Molekulare Analyse des Kolumnar-Gens beim Apfel (Malus x domestica) Dissertation zur Erlangung des Grades Doktor der Naturwissenschaften (Dr. rer. nat.) am Fachbereich Biologie der Johannes Gutenberg-Universität in Mainz Institut für Molekulargenetik, Gentechnische Sicherheitsforschung und -beratung vorgelegt von Dominik Otto Geboren am 06. Januar 1983 in Bad Hersfeld Mainz, 2013 Dekan: 1. Berichterstatter: 2. Berichterstatter: Tag der mündlichen Prüfung: 24.01.2014 INHALTSVERZEICHNIS INHALT 1 Einleitung .............................................................................................................................. 1 1.1 Der Kulturapfel, Malus x domestica .............................................................................. 1 1.2 Kolumnarwachstum beim Apfel .................................................................................... 3 1.3 Pflanzengenome und transposable Elemente ............................................................... 6 1.4 Positionelle Klonierung ................................................................................................ 12 1.5 Molekulare Marker ...................................................................................................... 14 1.6 Zielsetzung ................................................................................................................... 19 2 Material und Methode ........................................................................................................ 21 2.1 Allgemeine Methoden zum Arbeiten mit DNA ............................................................ 21 2.1.1 Elektrophoretische Auftrennung von DNA ........................................................... 21 2.1.2 Wiedergewinnung von DNA-Fragmenten aus Agarosegelen ............................... 22 2.1.3 Phenol-Chloroform-Extraktion ............................................................................. 23 2.1.4 Fällung von DNA ................................................................................................... 23 2.1.5 Polymerase-Ketten-Reaktion (PCR) ...................................................................... 24 2.1.6 Aufreinigung von PCR-Produkten ......................................................................... 25 2.1.7 Klonierung von PCR-Produkten ............................................................................ 25 2.1.8 Southern Blot ........................................................................................................ 25 2.1.9 „Pirotta“ Blot ........................................................................................................ 27 2.2 Konstruktion einer Apfel-BAC-Bibliothek .................................................................... 27 2.2.1 Versuchsmaterial .................................................................................................. 27 2.2.2 Isolation von Zellkernen ....................................................................................... 27 2.2.3 Kern-Lyse und Proteinase K-Verdau ..................................................................... 28 2.2.4 Restriktion ............................................................................................................ 28 2.2.5 Größenfraktionierung ........................................................................................... 29 2.2.6 Test zur Überprüfung der Integrat-Enden ............................................................ 30 2.2.7 Ligation ................................................................................................................. 31 2.2.8 Transformation mittels Elektroporation............................................................... 31 2.2.9 Herstellung elektrokompetenter Zellen ................................................................ 32 2.2.10 BAC-Minipräparation ......................................................................................... 32 2.3 Screening einer Apfel-BAC-Bank .................................................................................. 33 2.3.1 Konstruktion PCR-basierender Sonden ................................................................. 33 2.3.2 Koloniefilter-Hybridisierung ................................................................................. 34 I 2.3.2.4 Randsequenzierung ........................................................................................... 35 2.4 Sequenzierung relevanter Klone mittels shotgun-Bibliotheken .................................. 35 2.3.1 Plasmid-Isolierung nach Whitehead ..................................................................... 36 2.3.2 Nebulisieren der Plasmid-DNA und Endfilling ....................................................... 36 2.3.3 Größenfraktionierung und Elektroelution ............................................................. 37 2.3.4 Ligation und Transformation ................................................................................ 37 2.3.5 Überprüfung der shotgun-Bibliothek und Sequenzierung .................................... 37 2.3.6 Auswertung von DNA-Sequenzen ......................................................................... 38 2.5 Sequenzierung von BAC-Klonen mittels Illumina Next-Generation Sequencing ......... 38 2.5.1 Plasmid-Isolierung nach Promega ........................................................................ 39 2.5.2 Auswertung der Illumina Next-Generation Sequencing Sequenzdaten ................ 39 2.5.3 Überprüfung der Kandidaten der BAC-Klone ........................................................ 40 2.6 Illumina Next-Generation Sequencing genomischer Apfel-DNA ................................. 41 2.6.1 Erstellung einer „mate pair“-Bibliothek ................................................................ 41 2.6.2 Sequenzierung und Filterung der Rohdaten ......................................................... 43 2.7 Erstellung eines Gesamtcontigs der Co-Zielregion ...................................................... 44 2.7.1 Erstellung von Metacontigs .................................................................................. 44 2.7.2 Konstruktion eines Gesamtcontigs ....................................................................... 44 2.8 Annotation von Genen und transposablen Elementen ............................................... 44 2.8.1 Annotation von Genen .......................................................................................... 44 2.8.2 Annotation von transposablen Elementen ........................................................... 45 2.9 Herstellung Co-Gen gekoppelter Marker ..................................................................... 45 2.9.1 Versuchsmaterial .................................................................................................. 45 2.9.2 Primerdesign für PCR-basierende Marker ............................................................ 46 2.9.3 Testen von Kandidaten für Co-Gen gekoppelter Marker ...................................... 46 2.9.4 Klonierung Co-Gen gekoppelter Marker und Sequenzierung ............................... 46 2.10 Standardlösungen und Materialien ........................................................................... 47 3 Ergebnisse............................................................................................................................ 49 3.1 Festlegung der Co-Zielregion ....................................................................................... 49 3.2 Erstellung von Apfel-BAC-Bibliotheken ........................................................................ 50 3.3 Screening der Apfel-BAC-Bibliotheken ........................................................................ 55 3.4 BAC-Klone aus der Co-Zielregion und Illumina Next-Generation Sequencing ............. 58 3.4.1 Sequenzierung und Assemblierung der BAC-Klone ............................................... 58 3.4.2 Genomische Illumina-Sequenzdaten der Apfelsorte P28 ...................................... 60 3.4.3 Analyse chimärer BAC-Klone ................................................................................. 62 3.5 Analyse der genomischen Co-Gen-Region ................................................................... 66 II 3.5.1 Konstruktion von Metacontigs und eines Gesamtcontigs .................................... 66 3.5.2 Sequenzvergleiche der Apfelsorten P28 und GD .................................................. 69 3.5.3 Annotation von Genen und transposablen Elementen ........................................ 75 3.7 Molekulare Co-Gen gekoppelte Marker ...................................................................... 85 3.7.1 Identifikation Co-Gen gekoppelter Marker .......................................................... 85 3.7.2 Feinkartierung der Zielregion ............................................................................... 88 3.7.3 Markeranalysen anderer Apfelsorten .................................................................. 91 3.7.4 Transposon-basierende Marker ........................................................................... 94 4 Diskussion ........................................................................................................................... 97 4.1 Bestimmung der Co-Zielregion .................................................................................... 97 4.2 Genomische Apfel-BAC-Bibliotheken .......................................................................... 99 4.3 Erstellung einer Referenzsequenz der Co-Zielregion ................................................ 101 4.4 Analyse der Co-Zielregion .......................................................................................... 107 4.5 Identifizierung der Co-Mutation ................................................................................ 109 5 Zusammenfassung ............................................................................................................ 117 Abkürzungsverzeichnis ......................................................................................................... 118 Abbildungsverzeichnis ......................................................................................................... 121 Tabellenverzeichnis .............................................................................................................. 122 Webverzeichnis .................................................................................................................... 123 Literaturverzeichnis ............................................................................................................. 124 Anhang ................................................................................................................................. 137 A1 Vektorkarten .............................................................................................................. 137 A2 Sonden für das Screening von genomischen Apfel-BAC-Bibliotheken ....................... 139 A3 Markeranalysen mittels QIAxcel ................................................................................ 141 A4 Markertests diverser Apfelsorten mittels selbst erstellter Marker ........................... 142 A5 Inhaltsverzeichnis des elektronischen Anhangs ......................................................... 143 Curriculum Vitae .................................................................................................................. 144 Danksagung .......................................................................................................................... 146 Eidesstattliche Erklärung ...................................................................................................... 147 III EINLEITUNG 1 Einleitung 1.1 Der Kulturapfel, Malus x domestica Im Jahr 2011 waren Äpfel hinter Bananen (107 Mt) und Wassermelonen (102 Mt) mit einer Jahresproduktion von über 75 Mio. Tonnen die am häufigsten angebaute Obstart weltweit (FAO, 2013). Nach dem Pro-Kopf-Verbrauch zu urteilen, waren im Jahr 2011 Apfelsaft und Apfelsaftschorle mit zusammen 17,4 Litern in Deutschland die beliebtesten Fruchtsaftgetränke (Vdf, 2013) und Äpfel mit 19,5 kg pro Privathaushalt das meist geschätzte Obst (AMI GmbH, 2013). Der Apfel verdankt seine Beliebtheit vor allem der guten Lagerfähigkeit und seinem enormen Spektrum an Zubereitungsmöglichkeiten (Luby 2003). Darüber hinaus gelten Äpfel als gesundheitsfördernd und vorbeugend gegen Herz- Kreislauf-Erkrankungen, Asthma, Diabetes und Krebs (Boyer und Liu 2004; Gerhauser 2008). Äpfel werden in 93 Ländern auf einer Fläche von über 4,7 Mio. Hektar angebaut. Der Hauptproduzent im Jahr 2011 war China mit 36 Mio. Tonnen, gefolgt von den USA und Indien mit 4,3 und 2,9 Mio. Tonnen. Deutschland lag auf Platz 14 mit fast 900.000 Tonnen (FAO, 2013). Der Apfel gehört systematisch betrachtet in der Familie der Rosengewächse (Rosaceae) zur Unterfamilie der Spiraeoideae. Innerhalb dieser Unterfamilie zählt der Apfel neben Birne, Quitte und Mispel zum Tribus Pyreae, genauer zum Untertribus Pyrinae (Kernobstgewächse). Die Kernobstgewächse wurden lange Zeit als eigene Unterfamilie (Maloideae) der Rosengewächse geführt; neuere molekulargenetische Untersuchungen zeigen jedoch eine Zugehörigkeit zu der Unterfamilie Spiraeoideae (Potter et al. 2007). Die Gattung Äpfel (Malus) umfasst zwischen 25 und 47 Arten (Robinson et al. 2001), die weltweit bekannteste und wirtschaftlich bedeutendste Art ist der Kulturapfel (Malus x domestica). Die Anzahl der bekannten Apfelsorten wird weltweit auf über 20.000 geschätzt. Der haploide Chromosomensatz (x) der meisten Rosengewächse beträgt 7, 8 oder 9. Im Gegensatz dazu haben die Pyreae einen haploiden Chromosomensatz von 17 (Chevreau et al. 1985). Es existieren zwei Hypothesen zur Entstehung dieser außergewöhnlich hohen Chromosomenzahl in Pyreae, zum einen durch Allopolyploidisierung zwischen spiraeoiden (x=9) und amygdaloiden (x=8) Vorfahren (Phipps et al. 1991), zum anderen durch Autopolyploidisierung eines Vorfahrens mit x=9 wie etwa Gillenia durch Diploidisierung und Aneuploidisierung (Evans und Campbell 2002). Neuere Ergebnisse unterstützen die Hypothese der Entstehung der Pyreae durch Autopolyploidisierung. Maliepaard et al. 1 EINLEITUNG (1998) fanden anhand von molekularen Markern bereits große Homologien zwischen unterschiedlichen Chromosomen, beispielsweise zwischen „Linkage Group“ (LG) 5 und LG 10. Velasco et al. (2010) bestätigten dies durch paarweise Vergleiche der Apfelchromosomen und identifizierten große homologe Bereiche zwischen den Chromosomen 3 und 11, 5 und 10, 9 und 17 und 13 und 16, sowie weitere kleinere Homologien, was insgesamt für eine genomweite Duplikation (GWD) infolge einer Autopolyploidisierung spricht. Die molekulare Phylogenie der Wx-Gene („waxy genes“) belegt eine enge Verwandtschaft zwischen Gillenia und Pyreae, ein weiteres Indiz für eine Autopolyploidisierung (Velasco et al. 2010). Der Kulturapfel entstand vermutlich aus interspezifischen Hybridisierungen. Daher ist der Name Malus x domestica wissenschaftlich anerkannt (Korban und Skirvin 1984). Taxonomisch betrachtet sind die am nächsten verwandten Arten zu Malus x domestica die asiatischen Arten Malus x asiatica, Malus baccata, Malus micromalus, Malus orientalis, Malus prunifolia und Malus sieversii, sowie die europäische Spezies Malus sylvestris. Diese Arten sind vermutlich mehr oder weniger an der Entstehung des Genpools des Kulturapfels beteiligt (Robinson et al. 2001). Malus sieversii ist jedoch die einzige wild vorkommende Art, die alle Qualitäten des Kulturapfels in Bezug auf Frucht- und Baummorphologie aufweist (Forsline et al. 2002). Juniper und Mabberley (2006) postulierten, dass es sich daher bei Malus sieversii und Malus x domestica um die gleiche Spezies handele und führten die einheitliche Bezeichnung Malus pumila ein. Die Sequenzierung des Genoms eines Kulturapfels (Golden Delicious, GD) belegte nicht nur den hohen Verwandtschaftsgrad zwischen Malus x domestica und Malus sieversii, sondern bestätigte darüber hinaus, dass es sich um dieselbe Art handelt (Velasco et al. 2010). Obwohl Malus pumila die anerkannte Bezeichnung ist, wird in dieser Arbeit die Bezeichnung Malus x domestica für den Kulturapfel verwendet. Neuste molekulare Analysen belegen, dass der europäische Wildapfel Malus sylvestris nach Malus sieversii den größten Anteil am Genpool des Kulturapfels ausmacht, was dazu führt, dass einige Sorten des Kulturapfels mit Malus sylvestris näher verwandt sind als mit Malus sieversii (Cornille et al. 2012). Malus sieversii stammt ursprünglich aus dem Gebiet um das Tian Shan-Gebirge, das sich über das heutige Staatsgebiet von China, Kasachstan, Kirgisistan, Usbekistan und Tadschikistan erstreckt (Morgan und Richards 1993). Um Almaty, früher Alma-Ata (übersetzt: „Großvater des Apfels“), liegt das Zentrum der größten Diversität und der Ursprung des Kulturapfels (Vavilov 1926; Janick et al. 1996). Von dort wurde der Kulturapfel vermutlich durch Römer 2 EINLEITUNG und Griechen entlang der Seidenstraße nach Europa und Nordafrika gebracht, ehe er sich weltweit verbreitete (Juniper und Mabberley 2006). Archäologische Funde über das Sammeln von Wildäpfeln in Europa gehen zurück in das Neolithikum (vor 11.200 Jahren) und die Bronzezeit (vor ca. 4.500 Jahren) (Hopf 1973; Schweingruber und Hopf 1979). Vor rund 4.000 Jahren traten im Nahen Osten bereits Formen des Apfels auf, die mit dem heutigen Kulturapfel vergleichbar sind (Zohary und Hopf 2000). Der Ursprung der kontrollierten Züchtung wird Thomas Andrew Knight im Jahr 1806 zugeschrieben, der den ersten Kultivar mit bekannten Eltern züchtete (Janick et al. 1996). Der hohe Grad an Selbstinkompatibilität und der stark heterozygote Charakter des Genoms sowie eine lange juvenile Phase von sechs bis acht Jahren erschweren die konventionelle Züchtung des Kulturapfels seit jeher (Korban und Chen 1992; Hemmat et al. 1994). Abhilfe schaffen könnte jedoch die Hochgeschwindigkeitszüchtung, eine Errungenschaft neuester Forschungen, bei der die juvenile Phase stark verkürzt ist. Dies gelingt durch die Erstellung transgener Apfellinien mit früher Blüte durch Überexpression des Gens BpMADS4 aus der Birke (Flachowsky et al. 2011). Darüber hinaus können durch molekularen Gentransfer, etwa Agrobacterium tumefaciens-vermittelt, gezielt Gene in das Genom der gewünschten Apfelsorte integriert werden (Malnoy et al. 2007; Flachowsky et al. 2010). 1.2 Kolumnarwachstum beim Apfel Das Kolumnarwachstum geht auf eine Zufallsmutante der Apfelsorte McIntosh zurück, welche erstmals 1969 von Fisher beschrieben wurde. Sie wurde in den frühen 1960er Jahren in einer Obstanlage im Okanagan Valley (British Columbia, Kanada) beobachtet und nach ihrem Entdecker, dem aus Polen stammenden Obstbauern Wijcik, als „McIntosh Wijcik“ benannt (Fisher 1970). Die Mutation trat in einem einzelnen Trieb an der Spitze eines 50 Jahre alten normalwüchsigen Apfelbaums der Sorte McIntosh auf (Looney und Lane 1984). Diese als Knospen- oder Sprossmutationen bezeichneten vegetativen Veränderungen („Sports“) sind von großer züchterischer Bedeutung und werden seit jeher zur Etablierung neuer Sorten genutzt (Schmidt 1937). Der kolumnare Phänotyp stellt eine extreme Form des Kurztriebwuchses („spur type growth“) dar (Blažek 1992), charakterisiert durch verkürzte Internodien, eine sehr kompakte Wuchsform, eine geringe Anzahl an Seitentrieben bis zum vollständigen Fehlen dieser und eine damit verbundene erhöhte Anzahl an Fruchtspießen (Lapins 1969). In Abbildung 1.1 sind Fotos solcher kolumnaren Apfelbäume abgebildet. In seltenen Fällen treten längere Seitentriebe auf, welche in der 3 EINLEITUNG Regel parallel zum Hauptspross wachsen (Hemmat et al. 1997). Der Ausprägungsgrad des Kolumnarwachstums hängt von zahlreichen Faktoren ab, etwa dem Alter der Pflanzen und Umwelteinflüssen wie beispielsweise dem Klima und der Unterlage (Kenis und Keulemans 2007). Abbildung 1.1 Kolumnare Apfelbäume Die Fotos zeigen kolumnare Apfelbäume zur Zeit des Fruchtstandes. Die Bilder wurden 2003 in der Forschungsanstalt Geisenheim aufgenommen. Die Seitentriebe sind in Fruchtspieße umgewandelt, sodass die Früchte direkt am Stamm wachsen (A). Der sehr kompakte Wuchscharakter der Bäume ermöglicht eine sogenannte Doppelreihpflanzung, wodurch der Ertrag erheblich gesteigert werden kann (B). Kolumnare Apfelbäume sind von großem wirtschaftlichem Interesse. Die kompakte Wuchsform ermöglicht ein sehr dichtes Pflanzen der Bäume (Abbildung 1.1 B), sodass der Ertrag von durchschnittlich 30 bis 60 t/ha bei normalwüchsigen Bäumen auf über 100 t/ha gesteigert werden kann (Jacob 2010). Weitere Aspekte sind die Kosten- und Zeitersparnisse durch ein Ausbleiben bzw. eine Minimierung des Beschneidens der Bäume und eine Ernte der Früchte mittels Vollerntemaschinen (Tobutt 1985). Darüber hinaus führt der Säulenwuchs zu einer gleichmäßigen Sonneneinstrahlung auf die Früchte, was eine homogene Entwicklung, Reifung und Färbung der Früchte begünstigt (Kenis und Keulemans 2007). Neben diesen positiven Aspekten weisen kolumnare Apfelbäume jedoch auch einige negative Eigenschaften auf. So ist die Sorte McIntosh Wijcik stark anfällig gegen Apfelschorf, die Lagerfähigkeit der Früchte ist stark begrenzt und die Fruchtqualität kann nicht mit der weit verbreiteter Sorten wie etwa Golden Delicious oder Gala mithalten (Meulenbroek et al. 1998, P. Braun, pers. Kommunikation). Aus diesem Grund wurden weltweite Züchtungsprogramme initiiert, um das kolumnare Wachstum mit den positiven 4 EINLEITUNG Fruchteigenschaften der kommerziell erfolgreichen Apfelsorten und deren Resistenzen gegen Schorf und weitere Krankheiten zu kombinieren (Petersen und Krost 2013). Dies ist jedoch aufgrund der bereits genannten Schwierigkeiten bei der Züchtung sehr zeit- und kostenintensiv. Der stark veränderte Wuchscharakter eines kolumnaren im Vergleich zu einem normalwüchsigen Apfelbaum legt die Vermutung nahe, dass veränderte Phytohormon- Konzentrationen eine entscheidende Rolle bei der Ausprägung des kolumnaren Phänotyps spielen. In mehreren Studien konnte gezeigt werden, dass kolumnare Bäume im Vergleich zu normalwüchsigen Bäumen höhere Konzentrationen an freien Auxinen und Cytokininen in der Sprossspitze aufweisen (Looney und Lane 1984; Watanabe et al. 2004; 2008). Hingegen ist die Konzentration an Abscisinsäure und polaren Gibberellinen in kolumnaren Apfelsorten im Vergleich niedriger (Lee und Looney 1977; Looney und Lane 1984). Krost et al. (2012) konnten durch Transkriptomanalysen des Sprossapikalmeristems der kolumnaren Sorte Procats 28 (P28) im Vergleich zur nicht kolumnaren Sorte A14-190-93 (A14) diese Resultate größtenteils bestätigen. Gene für die Biosynthese und Signaltransduktion des Auxins IAA sind aktiv, gegenteiliges gilt für die Biosynthese und Signaltransduktion von Gibberellinen. Kreuzungsanalysen zwischen kolumnaren und normalwüchsigen Eltern führten zu dem Schluss, dass ein dominantes Allel des Kolumnargens (Co-Gen) für die Ausprägung des Säulenwuchses verantwortlich ist (Lapins 1969; Lapins und Watkins 1973). Allerdings spalten sich die Nachkommen einer Kreuzung zwischen Co/co und co/co nicht wie man es für einen Mendelschen Erbgang erwarten würde im Verhältnis 1:1 (kolumnar:nicht kolumnar) auf. Meist liegt die Zahl der kolumnaren Nachkommen mit rund 44 % knapp unter den erwarteten 50 % (Lapins 1969). Aus diesem Grund geht man von einem oder mehreren untergeordneten Modifikatoren aus, die neben dem Co-Gen eine entscheidende Rolle bei Vererbung und Ausprägung des Kolumnarwachstums spielen (Lapins 1976). Bislang sind alle untersuchten kolumnaren Apfelsorten heterozygot für Co (Tian et al. 2005). Allerdings ist es der Universität Geisenheim (Deutschland) gelungen, eine homozygote kolumnare Apfelsorte zu züchten. Kreuzungen mit dieser Apfelsorte führen ausschließlich zu kolumnarwüchsigen Nachkommen (P. Braun, pers. Kommunikation). Für die Züchtung ist es von erheblicher Bedeutung, möglichst früh detektieren zu können, ob ein Nachkomme kolumnar- oder normalwüchsig ist. Phänotypisch können erst nach zwei bis drei Jahren zuverlässige Aussagen über den Wuchscharakter getroffen werden (Blažek 5 EINLEITUNG 1992; Baldi et al. 2012). Eine große Schwierigkeit stellen dabei die vielen existierenden Zwischenformen dar (Ikase und Dumbravs 2004; Moriya et al. 2009). Aus diesen Gründen ist die Verfügbarkeit zuverlässiger molekularer Marker für die Züchtung von erheblicher Bedeutung. Darüber hinaus ermöglichen molekulare Marker ein Lokalisieren des Co-Gens auf genomischer Ebene – ein essentieller Schritt, um die bisher unbekannte Natur der Co- Mutation zu untersuchen. Neben dem Kolumnarwachstum im Apfel sind ähnliche Wuchsformen in der Sauerkirsche (Schuster 2009) und im Pfirsich (Yamazaki et al. 1987) beschrieben. Allerdings sind die molekularen Mechanismen weitgehend unerforscht. Während für die Sauerkirsche keine molekularen Hintergründe bekannt sind, wird das Kolumnarwachstum im Pfirsich möglicherweise durch ein rezessives Gen (broomy, br) verursacht. Da es sich beim Apfel jedoch um eine dominante Mutation handelt, sind vermutlich verschiedene Mechanismen für die Ausprägung eines ähnlichen Phänotyps verantwortlich (Sajer et al. 2012). 1.3 Pflanzengenome und transposable Elemente Höhere Pflanzen besiedeln nahezu jedes Ökosystem der Erde und sind als Nahrungs-, Roh- und Sauerstofflieferant essentiell für das Leben von Mensch und Tier. Die Lebensformen reichen von sehr kleinen Pflanzen mit einer Länge von weniger als einem Millimeter wie die Zwergwasserlinse bis hin zu Mammutbäumen mit einer Höhe von über 100 Metern und einem Stammdurchmesser von mehr als 10 Metern (Paterson et al. 2010). Bedingt durch ihre sessile Lebensweise entwickelten Pflanzen zahlreiche Strategien zum Schutz vor Fressfeinden, Pathogenen und wechselnden Umweltbedingungen (Sterck et al. 2007). Möglicherweise ist dies einer der Gründe für die meist größeren Genome und komplexeren Genomstrukturen von Pflanzen im Vergleich zu denen der Tiere (Gregory 2005). Ein weiterer Grund liegt in mehreren genomweiten Duplikationen während der Evolution von Pflanzen (Proost et al. 2011). Zur Komplexität der Pflanzengenome tragen darüber hinaus starke Heterozygotien sowie Polyploidien bei (Hamilton und Robin Buell 2012). Die Publikation des ersten sequenzierten Pflanzengenoms im Jahr 2000 der Pflanze Arabidopsis thaliana stellte einen wichtigen Schritt in der Analyse von Genomstrukturen in Pflanzen dar (TAGI 2000). Im Laufe der vergangenen Jahre folgten, begünstigt durch den Aufstieg des Next-Generation Sequencings, zahlreiche weitere Genomsequenzierungen von vor allem wirtschaftlich relevanten Kulturpflanzen (Hamilton und Robin Buell 2012), von denen eine Auswahl in Tabelle 1.1 dargestellt ist. 6 EINLEITUNG Tabelle 1.1 Eine Auswahl sequenzierter Pflanzengenome 1 Spezies Genomgröße Gene TE Quelle Arabidopsis thaliana (Acker-Schmalwand) 125 Mbp 27.228 18,5 TAGI (2000) Glycine max (Sojabohne) 1,1 Gbp 46.430 50,3 Schmutz et al. (2010) Malus x domestica (Apfel) 742,3 Mbp 57.386 42,4 Velasco et al. (2010) Oryza sativa (Reis) 466 Mbp 40.577 39,5 Yu et al. (2002) Populus trichocarpa (Balsam-Pappel) 485 Mbp 45.654 35,0 Tuskan et al. (2006) Sorghum bicolor (Mohrenhirse) 730 Mbp 34.496 62,0 Paterson et al. (2009) Vitis vinifera (Wein) 487 Mbp 33.514 21,5 Jaillon et al. (2007) Zea mays (Mais) 2,3 Gbp 32.540 84,2 Schnable et al. (2009) 1 Prozentualer Anteil transposabler Elemente (TE) am Gesamtgenom Die Sequenzierung von Genomen beruht auf zwei verschiedenen Herangehensweisen (Green 2001). Bei der „clone by clone“-Strategie wird das Genom kloniert und ausgewählte Klone sequenziert. Im Gegensatz dazu steht die „whole genome shotgun“-Strategie, bei der das komplette Genom in kleine Fragmente zerlegt wird und diese sequenziert werden. Ein entscheidender Vorteil bei der Verwendung von klonierter genomischer DNA ist, dass ein Klon nur einen begrenzten chromosomalen Bereich enthält und die Komplexität im Vergleich zum Gesamtgenom stark reduziert ist (Imelfort und Edwards 2009). Neben der traditionellen Sanger-Sequenzierung ermöglicht die Verwendung von Next-Generation Sequencing, in Form von beispielsweise einer Roche 454 Pyro- oder einer Illumina- Sequenzierung, die Generierung von großen Datenmengen in kürzerer Zeit bei geringeren Kosten (Schatz et al. 2010). Dies hat dazu geführt, dass die Sequenzierung von Pflanzengenomen seit 2006 rasant zugenommen hat (Tabelle 1.1). Allerdings verursacht zum Beispiel die Illumina-Technologie Plattform, dass kürzere Sequenzen generiert werden, was wiederum erhebliche Probleme bei der Assemblierung der Daten erzeugt (Imelfort und Edwards 2009). Lediglich die Genome von Arabidopsis thaliana und Reis (Sanger- Sequenzierung in Kombination mit einer „clone by clone“-Strategie) sind tatsächlich weitgehend vollständig sequenziert, wohingegen es sich bei den anderen in Tabelle 1.1 aufgeführten Genomen um Entwürfe, sogenannte „draft genomes“, mit kleineren oder größeren Lücken handelt, die sich meist in repetitiven Elementen begründen (Claros et al. 2012). Pflanzen enthalten, bedingt durch genomweite Duplikationen, eine große Zahl an Genen (Sterck et al. 2007). Die Anzahl der vorhergesagten Gene ist Tabelle 1.1 zu entnehmen. Der Apfel besitzt im Vergleich zu anderen Kulturpflanzen mit 57.386 Genen, darunter 11.444 Apfel-spezifische Gene, die höchste Anzahl (Velasco et al. 2010). Die Ursache hierfür ist noch unklar, allerdings zeigt der Vergleich mit anderen sequenzierten Genomen, dass die 7 EINLEITUNG Gruppen von Genen, die im Apfel stärker vertreten sind, in direktem Zusammenhang mit der Reaktion auf Stress und Anpassung an die Umwelt stehen, sowie beteiligt an der Bildung von Holz und der Fruchtentwicklung sind (Troggio et al. 2012). In der Regel machen den größten Anteil pflanzlicher Genome aber nicht kodierende Bereiche aus, sondern repetitive Elemente, vor allem in Form von transposablen Elementen (Feschotte et al. 2002). Das Apfelgenom beispielsweise besteht zu 67 % aus repetitiven Elementen, wobei 42,4 % des Gesamtgenoms auf Transposons entfallen (Velasco et al. 2010). Im Mais machen transposable Elemente sogar 84 % des Genoms aus (Schnable et al. 2009). Aufgrund ihres hohen genomischen Anteils und der Fähigkeit an neuen Stellen im Genom zu integrieren, spielen transposable Elemente eine wichtige Rolle für die Struktur und Evolution von Pflanzengenomen (Bennetzen 2000). Oft verursachen sie weitreichende phänotypische Effekte in den Wirtspflanzen, die gewissermaßen auch der Auslöser für die Entdeckung der transposablen Elemente waren. So wurden sie erstmals im Mais von Barbara McClintock beschrieben (McClintock 1944). Sie untersuchte den C Locus, welcher für die Färbung von Maiskörnern verantwortlich ist. Bei Anwesenheit des Dissociation (Ds) Locus innerhalb des C Locus entsteht eine gelbe Färbung. Springt Ds aus diesem Locus, was die Anwesenheit eines Activator (Ac) Locus voraussetzt, entsteht wiederum das Wildtyp- Allel mit violetter Färbung (McClintock 1946, 1950; 1951; 1953). Mittlerweile ist bekannt, dass es sich bei Ds und Ac um Mitglieder einer Transposonfamilie (Ac/Ds) handelt (Bennetzen 2000). Ein wichtiges Merkmal bei der Charakterisierung transposabler Elemente einer Familie ist die Unterscheidung in autonome und nicht-autonome Elemente (Wicker et al. 2007). Ac besitzt alle benötigten Domänen zur Transposition und ist somit ein autonomes Element. Ds hingegen ist ein nicht-autonomes Element, da es nicht zur eigenständigen Transposition befähigt ist. Die Transposition nicht-autonomer Elemente durch Anwesenheit autonomer Elemente beschränkt sich nicht nur auf Mitglieder einer Familie, sondern gilt auch familienübergreifend, was als „cross-mobilisation“ bezeichnet wird (Feschotte et al. 2003). Das erste Klassifizierungssystem für Transposons wurde 1989 von Finnegan eingeführt. Es unterscheidet anhand der Zwischenstufe bei der Transposition. Die Zwischenstufe ist bei der Klasse I Transposons (Retrotransposons) ein RNA-Molekül, bei Klasse II Transposons (DNA-Transposons) ein DNA-Molekül. Der Mechanismus der Transposition wird bei den Retrotransposons als „copy-and-paste“ bezeichnet (Finnegan 1989). Retrotransposons lassen sich aufgrund ihres Integrationsmechanismus weiter in LTR- und Non-LTR- 8 EINLEITUNG Retrotransposons unterteilen (Lisch 2013). Anhand des Grads ihrer Sequenzähnlichkeit (Xiong und Eickbush 1990) und der Reihenfolge der kodierten Gene (Bennetzen 1996) werden LTR-Retrotransposons in die Subklassen Ty1-Copia und Ty3-Gypsy untergliedert. Die Non-LTR-Retrotransposons lassen sich in LINEs (long interspersed nuclear elements) und SINEs (short interspersed nuclear elements) unterteilen. LINEs enthalten eine Vielzahl der Gene der LTR-Retrotransposons, sind aber ansonsten einfacher aufgebaut (Kumar und Bennetzen 1999). SINEs hingegen besitzen keines der für die Transposition benötigten Gene. Sie stammen bis auf wenige Ausnahmen (z. B. die Alu-Elemente) von tRNA-Genen ab (Okada 1991a, b). DNA-Transposons sind meist durch kurze „terminal inverted repeats“ (TIRs) und ein Transposase-Gen (TPase) charakterisiert (Jiang et al. 2004). Eine besondere Gruppe der DNA-Transposons stellen die sogenannten MITEs (miniature inverted-repeat transposable elements) dar. Diese nicht-autonomen Elemente sind besonders kurz (< 600 bp) und treten bevorzugt in nicht-kodierenden Bereichen von Genen auf (Bureau und Wessler 1992, 1994). Zudem stellen sie meist den Hauptanteil der DNA-Transposons. In Arabidopsis wurden im Vergleich zu ungefähr 1.000 anderen DNA-Transposons etwa 1.200 MITEs identifiziert (TAGI 2000). In Abbildung 1.2 sind die Hauptgruppen der transposablen Elemente dargestellt, die in Pflanzen vorkommen. 9 EINLEITUNG Abbildung 1.2 Transposable Elemente in Pflanzen Die Abbildung zeigt schematisch die Struktur transposabler Elemente in Pflanzen, aufgeteilt in Retrotransposons (grau hinterlegt) und DNA-Transposons (weiß hinterlegt). Die Retrotransposons sind unterteilt in LTR-Retrotransposons mit den Hauptvertretern Copia und Gypsy und in Non-LTR- Retrotransposons mit den Vertretern LINE und SINE. Die DNA-Transposons gliedern sich in ein allgemeines autonomes Element, ein allgemeines nicht-autonomes Element mit nicht funktionsfähiger Transposase und in ein MITE. TS: „target site“; LTR: „long terminal repeat“; PBS: „primer binding site“; PPT: „polypurine tract“; PR: Protease; INT: Integrase; RT: reverse Transkriptase; RH: RNaseH; EN: Endonuklease; A, B: A- und B-Promotor Erkennungsstelle für die RNA Polymerase III; (A): Abfolge der Base Adenin; TIR: „terminal inverted repeat“; TPase: Transposase; GAG: Capsid Protein Die Grafik wurde in Anlehnung an die Publikationen von Casacuberta und Santiago (2003), Kumar und Bennetzen (1999) und Wicker et al. (2007) erstellt. Charakteristisch für transposable Elemente ist die „target site“ (TS), bzw. die bei der Integration eines Transposons an einen neuen Locus entstehende Duplikation dieser Sequenz („target site duplication“, TSD). So besitzen LTR-Retrotransposons typischerweise eine TSD von 4 bis 6 bp, hAT Elemente, eine Superfamilie der DNA-Transposons, hingegen eine TSD von 8 bp (Wicker et al. 2007). Eine Ausnahme bilden die Helitrons, eine weitere 10 EINLEITUNG Superfamilie der DNA-Transposons. Diese transposablen Elemente bedienen sich im Fall einer Transposition im Vergleich zum „cut-and-paste“-Mechanismus der meisten DNA- Transposon einem „rolling circle“-Mechanismus, bei dem keine TSD entsteht (Kapitonov und Jurka 2001). Transposable Elemente sind aufgrund ihrer Transpositionsmöglichkeiten der variabelste Teil eines Genoms und besitzen einen großen Einfluss auf dessen Architektur (Lisch 2013). Die Art und Weise, wie Transposons zu genotypischen und phänotypischen Veränderungen führen, ist sehr unterschiedlich. Im Folgenden sollen einige Möglichkeiten anhand von Beispielen erläutert werden. Der einfachste Weg ist die Inaktivierung von Genen durch Erzeugung einer Nullmutation. Beispielsweise zerstört die Integration eines LTR- Retrotransposons in ein Intron des MdPI Gens bei den Apfelsorten Rae Ime, Spencer Seedless und Wellington Bloomless dessen Funktionsfähigkeit, was zu kernlosen Früchten führt (Yao et al. 2001). Die Insertion von Transposons in regulatorische Elemente wie Enhancer oder Silencer kann zu einer veränderten Genexpression führen. Ein besonders eindrucksvolles Beispiel ist der Vegetative to generative transition 1 (Vgt1)-Locus im Mais. Die Integration eines MITEs in eine CNS („conserved non-coding sequence“) des Vgt1, der sich rund 70 kb „upstream“ des Transkriptionsfaktors ZmRap2.7 befindet, führt zu dessen Überexpression, was sich phänotypisch in einer späteren Blütezeit ausprägt (Salvi et al. 2007). Neben dem Einfluss auf die Genexpression durch Beeinflussung bereits vorhandener regulatorischer Elemente gibt es Beispiele, in denen Transposons durch Einbringen neuer Enhancer oder Promotoren die Genexpression verändern. Dies wird dadurch begünstigt, dass einige transposable Elemente bevorzugt in 5‘-Bereiche von Genen springen, nicht aber in Exons (Naito et al. 2009). Die Enhancer Aktivität des Retrotransposons Hopscotch, welches im Mais rund 60 kb „upstream“ des teosinte branched 1 (tb1)-Locus integrierte, führt zu einer Überexpression von tb1 (Studer et al. 2011). Es handelt sich bei tb1 um einen Transkriptionsfaktor, der die Ausbildung von Verzweigungen unterdrückt. Dies führt zu einer starken Verringerung der Seitentriebe im Mais im Vergleich zum Teosinte, der als Urvater des Kulturmais gilt (Doebley et al. 2006). Neben regulatorischen Informationen enthalten autonome DNA-Transposons ein Transposase-Gen, welches neben seiner Funktion für die Transposition möglicherweise auch eine wichtige Rolle für die Wirtspflanze spielt (Muehlbauer et al. 2006). In Arabidopsis thaliana konnte gezeigt werden, dass das Gen DAYSLEEPER, welches essentiell für eine normale Wuchsform der Pflanzen ist, von dem Transposase-Gen eines hAT-Elements abstammt (Bundock und Hooykaas 2005). Darüber 11 EINLEITUNG hinaus kann es durch die Integration eines Transposons auch zu epigenetischen Veränderungen kommen. Im Fall des FLOWERING WAGENINGEN (FWA)-Locus in Arabidopsis thaliana bewirkt ein SINE, dass dieses Gen in vegetativen Geweben epigenetisch ausgeschaltet wird – ein Prozess in dem sowohl kleine RNAs wie auch DNA- Methylierung beteiligt sind (Kinoshita et al. 2007; Fujimoto et al. 2008). Mutanten, in denen das Gen nicht ausgeschaltet ist, zeigen eine späte Blüte. Ein epigenetisches Ausschalten von vor allem autonomer transposabler Elemente mittels kleiner RNAs, DNA-Methylierung und Histon-Modifizierung dient Pflanzen zur Kontrolle von und zum Schutz vor Transposons (Lisch 2009). Die bisher beschriebenen Einflüsse transposabler Elemente beziehen sich meist auf einzelne Gene, also begrenzte Loci. Transposons können jedoch auch zu größeren Veränderungen in der Architektur von Chromosomen führen. Dieses Phänomen ist beispielsweise beim Mais beschrieben, wo es durch Rekombination zwischen Ac-Elementen zu Deletionen, Inversionen und Translokationen kommt (Yu et al. 2011). 1.4 Positionelle Klonierung Die Schwierigkeit in der Sequenzierung von Pflanzengenomen liegt, wie bereits erwähnt, in der starken Ausprägung von Polyploidie, Heterozygotie und Paralogie, gepaart mit großen Genomen und einem hohen Anteil repetitiver Elemente (Hamilton und Robin Buell 2012). Oftmals sind jedoch nicht komplette Genome, sondern nur einzelne Gene oder Chromosomenbereiche von Interesse. Zur strukturellen und funktionellen Analyse meist unbekannter Gene ist die positionelle Klonierung nach wie vor eine weit verbreitete Methode. Grundvoraussetzungen hierfür sind die Verfügbarkeit genomischer DNA- Bibliotheken mit einer hohen Genomabdeckung und das Vorhandensein gekoppelter Marker, die das Gen von Interesse flankieren (Tanksley et al. 1995). Neben der Isolierung hochmolekularer DNA (Zhang et al. 1995) ist die Wahl eines geeigneten Vektors für die Konstruktion genomischer DNA-Bibliotheken von entscheidender Bedeutung. Weit verbreitete Vektoren sind „yeast artificial chromosome (YAC)“ (Burke et al. 1987), „bacterial artificial chromosome (BAC)“ (Shizuya et al. 1992) und „P1-derived artificial chromosome (PAC)” (Ioannou et al. 1994). YACs ermöglichen im Vergleich zu BACs und PACs sehr große Integrate. Während BACs und PACs DNA-Moleküle einer Größe von bis zu 300 kb aufnehmen können, sind bei der Verwendung von YACs Integratgrößen bis 2 Mb möglich (Monaco und Larin 1994). Allerdings weisen YACs auch erhebliche Nachteile auf: Sie sind oft instabil und neigen zur Bildung von Chimären (Green et al. 1991). Der Anteil an chimären 12 EINLEITUNG YACs beträgt bis zu 40 % (Umehara et al. 1995). Dies erschwert im Besonderen „Chromosome Walk“-Strategien zur Analyse eines größeren Genomabschnitts. Im Vergleich dazu machen bei BAC-Bibliotheken chimäre Klone lediglich 4 bis 11 % der Gesamtklone aus (Volik et al. 2003). Zudem ist die Isolierung von YAC-DNA kompliziert. Hauptfaktoren sind die enorme Größe und die Linearität der YACs und die darin begründete hohe Ähnlichkeit zum Wirtsgenom (Monaco und Larin 1994). Im Vergleich dazu können die zirkulären BACs und PACs mittels standardisierter Plasmidpräparationsprotokolle in ausreichender Menge gewonnen werden (Vinatzer et al. 1998). Die Linearität der YACs führt zu einem weiteren Nachteil. So ist die Effektivität der Transformation linearer Moleküle erheblich niedriger als zirkulärer (Woo et al. 1994). Darüber hinaus werden bei der Transformation Hefe- Sphäroplasten benötigt, deren Transformation relativ ineffizient ist. Somit werden große Mengen DNA zur Herstellung der Bibliothek benötigt (Monaco und Larin 1994). Die hohe Stabilität, die einfache Isolierung und der niedrige Anteil an chimären Klonen machen BACs zu idealen Vektoren für die Erstellung von genomischen DNA-Bibliotheken (Choi et al. 1995). Aus einer BAC-DNA-Bibliothek können dann mit Hilfe flankierender Marker Klone, die das gewünschte Gen bzw. Teile des Gen-Locus enthalten, identifiziert werden. Für das Screening einer DNA-Bibliothek gibt es prinzipiell zwei Strategien. Beim PCR-basierenden Screening werden die Plasmide der rekombinanten Klone isoliert und positive Klone durch PCR ermittelt (Kim et al. 1996). Durch die Verwendung von Pools ist dies eine schnelle Methode, die zudem sehr spezifisch ist (Xu et al. 2001). Eine Alternative stellt die Methode der Koloniefilter-Hybridisierung nach Grunstein und Hogness (1975) dar. Die Klone einer gesamten Genbank werden dazu auf Membranen übertragen, die anschließend mit radioaktiv- oder nicht-radioaktiv-markierten Sonden hybridisiert werden, um positive Klone zu identifizieren (Patocchi et al. 1999). Die Verwendung radioaktiv-markierter Sonden führt in der Regel schnell und eindeutig zu Hybridisierungssignalen von Klonen, die die zur Sonde homologen Sequenz enthalten (Kaufmann et al. 1997; Patocchi et al. 1999). Die Methode der Koloniefilter-Hybridisierung ist im Vergleich zur PCR-basierenden Methode weniger kostenintensiv, da nur die Plasmide hybridisierender Klone isoliert werden. Die anschließende Sequenzierung identifizierter Klone kann traditionell mittels Sanger- Sequenzierung, mittels neuerer Sequenziermethoden wie einer Roche 454 Pyro- oder einer Illumina-Sequenzierung oder aber durch eine Kombination der Methoden erfolgen (Imelfort und Edwards 2009). 13 EINLEITUNG 1.5 Molekulare Marker Gehölzpflanzen zeigen einen hohen Grad an genetischen Polymorphismen (Hamrick et al. 1990), was bei Kreuzungen zu einem hohen Maß an Heterozygotie in den einzelnen Individuen führt (Hemmat et al. 1994). Heterozygotien sind eine gute Voraussetzung für die Erstellung von molekularen Markern (Hemmat et al. 1994). In Kreuzungsexperimenten können anhand von molekularen Markern Kopplungskarten erstellt werden. Diese sind entscheidend bei der Aufklärung der genetischen Basis phänotypischer Merkmale und letztlich der Lokalisierung und Analyse von Schlüsselgenen (Tanksley et al. 1989), etwa bei der Kartierungs-gestützten Klonierung (Wing et al. 1994). Darüber hinaus sind molekulare Marker im Bereich der Züchtung von besonderer Bedeutung (Liebhard et al. 2002). Im Falle der Selektion hinsichtlich der kolumnaren Wuchsform dauert es etwa zwei bis drei Jahre, bis man anhand des Phänotyps geeignete Nachkommen erkennen kann (Moriya et al. 2009). Mithilfe von molekularen Markern kann man bereits deutlich früher selektieren und spart neben Zeit auch Kosten und Platz für die Kultivierung der Pflanzen (Conner et al. 1997). Die wichtigsten Arten von molekularen Markern sind im Folgenden kurz charakterisiert. Bei RFLP-Markern (restriction fragment length polymorphism) wird genomische DNA mit verschiedenen Restriktionsenzymen sequenzspezifisch geschnitten und die Restriktionsfragmente gelelektrophoretisch aufgetrennt (Beek et al. 1992). Infolge von Mutationen einzelner Basen, die Restriktionsschnittstellen generieren oder zerstören, sowie von Insertionen und Deletionen (Indels) können Unterschiede in der Größe der Restriktionsfragmente zwischen Individuen auftreten. Diese Unterschiede in der Größe der Restriktionsfragmente können durch Southern Blot-Hybridisierungen mit geeigneten „single copy“-Sonden detektiert werden (Botstein et al. 1980). Nachteile an RFLP-Markern sind der hohe Zeit- und Kostenaufwand bei der Analyse großer Populationen und die limitierte Verfügbarkeit geeigneter Restriktionsschnittstellen (Beckmann 1988). Die Verwendung von RAPD-Markern (randomly amplified polymorphic DNA) ist im Vergleich dazu wesentlich schneller und benötigt minimale Mengen an DNA (Williams et al. 1990). Durch PCR mit Primern zufälliger Basenzusammensetzung werden DNA-Fragmente unterschiedlicher Länge amplifiziert, welche anschließend mittels Gelelektrophorese aufgetrennt werden (Welsh und McClelland 1990). Polymorphismen treten durch das Vorhandensein beziehungsweise Fehlen von Banden auf, sowie in unterschiedlicher Größe der amplifizierten Bereiche. 14 EINLEITUNG Bei AFLP-Markern (amplified fragment length polymorphism) wird die DNA typischerweise mit den Restriktionsenzymen EcoRI und MseI verdaut und anschließend Adapter, die spezifisch für die Schnittstellen der Restriktionsenzyme sind, angefügt. Es folgt eine Amplifikation der Restriktionsfragmente durch PCR mit zur Adaptersequenz komplementären Primern. Zunächst wird mit Primern, die am 3’-Ende eine zusätzliche Base enthalten, eine selektive Präamplifikation durchgeführt, gefolgt von einer selektiven Amplifikation mit Primern, welche am 3‘-Ende zwei bis drei Basen in das zu amplifizierende Fragment hineinreichen. Durch das Anfügen der selektiven Basen am 3‘-Ende der Primer und die Verwendung zweier Restriktionsenzyme wird die Menge an verschiedenen Amplifikaten reguliert, sodass die Komplexität des resultierenden Musters gesteuert werden kann und auf diese Weise eine Art Fingerprint entsteht (Vos et al. 1995). Durch eine End-Markierung eines Primers (Fluoreszenz oder Radioaktivität) können die mittels Gelelektrophorese aufgetrennten Amplifikate detektiert werden. Anwendung finden die AFLP-Marker bei dem „genetischem Fingerabdruck“ in der Kriminalistik und beim Vaterschaftstest (Prochazka et al. 2001). Bei SSR-Markern (simple sequence repeat) dienen Polymorphismen in Mikrosatelliten als Marker (Litt und Luty 1989; Weber und May 1989). Mikrosatelliten sind kurze repetitive Sequenzen, welche tandemartig hintereinander angeordnet sind. Die Länge der sich wiederholenden Einheiten liegt meist zwischen 1 und 6 bp. Mikrosatelliten kommen sehr häufig, statistisch betrachtet etwa alle 50 kb, im Pflanzengenom vor (Morgante und Olivieri 1993), sind hypervariabel hinsichtlich der Zahl der „tandem repeats“ und über das komplette Genom verstreut (Wu und Tanksley 1993). Diese Eigenschaften machen Mikrosatelliten zu einer vielversprechenden Quelle für molekulare Marker. Die Entstehung der Hypervariabilität kann durch „replication slippage“ bei der mitotischen Vermehrung von Soma- und Keimzellen erklärt werden (Seyffert 2003). Die Fragmentlängenpolymorphismen der SSR-Marker werden durch PCR und anschließende Gelelektrophorese nachgewiesen. SCAR-Marker (sequence characteristic amplified region) sind sehr spezifische Marker, die einem genetischen Locus bekannter Sequenz entstammen (Paran und Michelmore 1993). Durch PCR mit spezifischen Primern wird der Locus amplifiziert und das Amplifikat gelelektrophoretisch aufgetrennt. Meist werden SCAR-Marker aus bekannten RAPD- oder AFLP-Amplifikaten entwickelt (Paran und Michelmore 1993; Kim et al. 2003). Die entsprechenden Fragmente werden dazu kloniert und sequenziert, um spezifische Primer erstellen zu können. Die Vorteile eines SCAR-Markers sind die Reproduzierbarkeit, eine 15 EINLEITUNG hohe Spezifität und eine einfache Handhabung (Tartarini et al. 1999; Tian et al. 2004). Indel-Marker (insertion deletion polymorphism) basieren auf Sequenzunterschieden zweier oder mehrerer Individuen in Form von Insertionen oder Deletionen, die durch direkten Sequenzvergleich detektiert werden (Rickert et al. 2003). Die entsprechenden Unterschiede werden mit flankierenden Primern mittels PCR amplifiziert und die Amplifikate anschließend gelelektrophoretisch aufgetrennt (Vali et al. 2008). SNPs (single nucleotide polymorphism) sind die am häufigsten auftretende Art an Sequenzvariation im Genom und damit hochinteressant für die Verwendung als molekulare Marker (Newcomb et al. 2006). Drei Arbeitsschritte sind üblicherweise notwendig, um SNP- Marker zu etablieren. Zunächst wird ein SNP bioinformatisch durch Sequenzvergleiche oder durch molekularbiologische Techniken wie die Allel-spezifische Hybridisierung (Kwok 2001) nachgewiesen. In einem zweiten Schritt wird der SNP validiert, das bedeutet beispielsweise den Ausschluss eines Sequenzierfehlers. In einem dritten und letzten Schritt werden eine Vielzahl an Individuen im Idealfall durch „high-throughput genotyping“-Verfahren auf den SNP hin untersucht (Chagné et al. 2008). Bis heute gibt es eine Vielzahl molekularer Marker, deren Kopplung mit dem Kolumnargen nachgewiesen ist. Bereits 1997 lokalisierten Conner et al. das Co-Gen auf Kopplungsgruppe 10 einer McIntosh Wijcik Kopplungskarte anhand der dominanten RAPD-Marker P459z-800 und P255a-1145. Allerdings bestand die Kopplungskarte noch aus 20 Kopplungsgruppen. Hemmat et al. (1997) verwendeten die Marker P459z-800, P255a-1145 und einen neuen Marker (SSRCo) in Kreuzungsexperimenten der Sorten McIntosh Wijcik und NY 75441-58. Anhand der Rekombinationsfrequenzen wurden die genetischen Abstände auf 24 cM für Co/P255a-1145, 8,9 cM für Co/P459z-800, 10 cM für SSRCo/P459z-800 und 6 cM für Co/SSRCo bestimmt. Das Co-Gen wird nach diesen Erkenntnissen von den Markern SSRCo und P459z-800 flankiert, mit Tendenz zu dem Marker SSRCo. Ein Jahr später bestätigten Maliepaard et al. (1998) mittels des SSR-Markers USA-SSR11 die Lokalisation des Co-Gens auf Kopplungsgruppe 10 einer Kopplungskarte der Sorten Prima und Fiesta (je 17 Kopplungsgruppen). Kim et al. (2003) untersuchten eine Nachkommenschaft der normalwüchsigen Sorte Fuji und kolumnaren Sorte Tuscan mit den molekularen Markern SSRCo, P459z-800 und P255a-1145, sowie dem selbst erstellten RAPD-Marker WB82670 beziehungsweise dem daraus resultierenden SCAR-Marker SCB82670. Der genetische Abstand für P459z-800 beträgt 10,8 cM, für SSRCo 19,1 cM und für SCB82670 lediglich 1,8 cM. Der RAPD-Marker P255a-1145 wies hingegen keine Kopplung mit dem Co-Gen auf. Tian et 16 EINLEITUNG al. (2005) untersuchten die Nachkommenschaft einer Kreuzung zwischen der normalwüchsigen Sorte Fuji und der kolumnaren Sorte Telamon mit den Markern SSRCo, P459z-800, P255a-1145 und SCB82670. Die genetische Distanz der Marker zu Co beträgt für SSRCo 26,5 cM und für P459z-800 13,2 cM. Sowohl für den Marker P255a-1145 wie auch für SCB82670 konnte keine Kopplung gefunden werden. Als Grund für den unterschiedlichen Kopplungsgrad der Marker SSRCo und P459z-800 werden die unterschiedlichen Populationsgrößen genannt (Kim et al. 2003; Tian et al. 2005). Tian et al. (2005) wiesen zudem eine starke Kopplung (3,9 cM) des Markers Ch03d11 (Liebhard et al. 2002) mit dem Co-Gen nach. Zudem etablierten sie den RAPD-Marker S1142682 und den AFLP-Marker E- ACT/M-CTA346, welche sie in die SCAR-Marker SCAR682 und SCAR216 konvertierten. SCAR682 und SCAR216 flankieren das Co-Gen mit genetischen Abständen von 2,9 und 12,3 cM. Moriya et al. (2009) zeigten für den SSR-Marker Hi01a03 (Silfverberg-Dilworth et al. 2006) eine enge Kopplung zum Co-Gen, darüber hinaus bestätigten sie die Kopplung der Marker SCAR682, SCAR216 und Ch03d011, widerlegten aber die Kopplung des Markers SCB82670 mit Co. SCB82670 scheint sortenspezifisch für Tuscan zu sein (Fernández-Fernández et al. 2008). Moriya et al. (2009) wiesen, wie bereits Tian et al. (2005), abweichende Rekombinationsfrequenzen ausgewählter Marker in unterschiedlichen Populationen nach. In einer Population der Kreuzung Fuji und 8H-9-45 cosegregieren Ch03d11 und SCAR682 mit Co. In einer Population der Kreuzung Fuji und 5-12786 hingegen beträgt der genetische Abstand zu Co für Ch03d11 und für SCAR682 1,4 cM. Bai et al. (2012) verwendeten neben den bereits genannten Markern SCAR682, Ch03d11 und Hi01a03, die SSR-Marker EMPc105 (Fernández-Fernández et al. 2006) und AU223548 (Silfverberg-Dilworth et al. 2006) zur groben Eingrenzung der Co-Gen-Region. Zur Feinkartierung wurden weitere SSR-Marker etabliert, die auf eine Nachkommenschaft von 528 Bäumen (4 Kreuzungen) und 290 weitere kolumnare Bäume getestet wurden. Der Marker C18470-25831 cosegregiert in allen getesteten Pflanzen mit Co, der Marker C1753-3520 weist zwei Rekombinante auf, die Marker C7629-22009 und C6835.383-2 einen beziehungsweise vier Rekombinante (Bai et al. 2012). Moriya et al. (2012) etablierten weitere SSR-Marker durch Kreuzungsanalysen an 1000 Nachkommen (31 Populationen). Sie fanden drei SSR-Marker, die in allen Nachkommen mit Co cosegregieren; dies sind Mdo.chr10.12, Mdo.chr10.13 und Mdo.chr10.14. Flankiert wird die vermutete Co-Gen-Region mit den Markern Mdo.chr10.11 und Mdo.chr10.15 mit einem genetischen Abstand zu Co von lediglich 0,1 bzw. 0,2 cM. Weitere Kreuzungsanalysen wurden von Baldi et al. (2012) durchgeführt. Sie untersuchten 17 EINLEITUNG 1250 Nachkommen zweier Kreuzungen zwischen GD und McIntosh Wijcik und etablierten unter anderem die Co-Gen gekoppelten SSR-Marker Co04R11 (0,4 cM), Co04R12 (gekoppelt) und Co04R13 (0,16 cM). Abbildung 1.3 zeigt die Co-Gen gekoppelten Marker angeordnet nach ihrer Lokalisation im GD-Genom auf Chromosom 10 (Velasco et al. 2010). Die RAPD-Marker P459z-800 und P255a-1145 (Conner et al. 1997) konnten nicht lokalisiert werden, da die Sequenzen nicht zur Verfügung stehen und die verwendeten Primer mit 10 Nukleotiden für eine erfolgreiche BLAST-Suche zu kurz sind. Der SCAR-Marker SCB82670 (Kim et al. 2003) ist ebenfalls nicht abgebildet, da er durch BLAST-Suchen auf Chromosom 3 Position 31,293 Mb im GD-Genom lokalisiert wurde. Abbildung 1.3 Co-Gen gekoppelte Marker Die Grafik zeigt eine Auswahl molekularer Marker, die Co-Gen gekoppelt sind. Die Anordnung der Marker erfolgte nach deren genomischer Lage im GD-Genom. Unterhalb der Namen der Marker sind ihre genetischen Abstände zum Kolumnargen aufgeführt (* und ** kennzeichnen Ergebnisse aus zwei verschiedenen Populationen). Die Schriftfarbe gibt Aufschluss über die Herkunft des Markers und den genetischen Abstand. Der Bereich 18,55 bis 19,1 Mbp auf Chromosom 10 ist im rechten Teil der Abbildung vergrößert dargestellt, da er vermutlich den Co-Locus enthält und dementsprechend eine hohe Markerdichte aufweist. 18 EINLEITUNG 1.6 Zielsetzung Das Ziel der vorliegenden Arbeit ist die Aufklärung der molekularen Ursache der Co- Mutation, die beim Apfel zum Kolumnarwachstum führt. Trotz der großen wirtschaftlichen Bedeutung sind die bisherigen Erkenntnisse über diese Mutation sehr begrenzt. Die Untersuchung von Co soll zunächst durch ein klassisches, positionelles Klonierungsexperiment erfolgen. Neben der Lokalisation der Co-Mutation und die Erstellung geeigneter Sonden soll mit Hilfe der Konstruktion von genomischen BAC- Bibliotheken mit mehrfacher Genomabdeckung die Co-Region kloniert und deren Sequenz bestimmt werden. Das Material stellt die Hochschule Geisenheim in Form von in-vitro- Kulturen der heterozygot kolumnaren Apfelsorte Procats 28 zur Verfügung. Genomische Illumina „mate pair“-Bibliotheken dieser Sorte sollen zudem sequenziert und bioinformatisch analysiert werden, um die genomische Region vollständig zu annotieren und, wenn möglich, die Sequenzen den jeweils homologen Chromosomen zuzuordnen. Somit soll eine möglichst vollständige genomische Referenz der Co-Region einer kolumnaren Apfelsorte erstellt werden, die die Grundlage für weitere Analysen bildet. Zusammenfassend soll in der vorliegenden Arbeit die „traditionelle“ Methode der positionellen Klonierung mit den neueren Techniken des Next-Generation Sequencings kombiniert werden, um auf diese Weise eine verlässliche und möglichst vollständige genomische Struktur der Zielregion zu etablieren. Des Weiteren sollen anhand der gewonnenen Sequenzinformationen neue mit der Co- Mutation gekoppelte Marker erstellt und getestet werden. Das Ziel der Generierung von eng gekoppelten Markern ist die Feinkartierung der genomischen Region, sowie die Möglichkeit, Apfelbäume bereits in einem frühen Entwicklungsstadium zuverlässig zu genotypisieren, was für die Apfelzüchtung von großer Bedeutung ist. Dazu steht eine Nachkommenschaft von etwa 100 Individuen einer Kreuzung der Apfelsorten Procats 28 und A14 zur Verfügung, sowie eine Sammlung genomischer DNAs von weiteren kolumnaren und nicht kolumnaren Apfelsorten. Die Arbeit ist ein Teilprojekt des vom Bundesministerium für Ernährung, Landwirtschaft und Verbraucherschutz geförderten Projekts (Nr. 511-06.01-28-1-43.042-07) zur Identifikation und Funktionsaufklärung des Co- Gens. 19 EINLEITUNG 20 MATERIAL UND METHODE 2 Material und Methode 2.1 Allgemeine Methoden zum Arbeiten mit DNA 2.1.1 Elektrophoretische Auftrennung von DNA Die Auftrennung von DNA-Molekülen erfolgte je nach Anwendung in unterschiedlichen Agarosegelelektrophorese-Systemen. Die verwendeten Protokolle wurden in Anlehnung an das Protokoll von Sambrook et al. (1989) erstellt. Als Marker dienten die in Abbildung 2.1 dargestellten Molekulargewichtsstandards der Fa. Fermentas (St. Leon-Rot, Deutschland). Die Proben wurden mit ca. 1/6 Volumen Bromphenolblau-DNA-Ladepuffer versetzt, um diese zu beschweren und um die Lauffront sichtbar zu machen. Lagen die zu erwartenden Banden in der Lauffront von Bromphenolblau, wurde als Ladepuffer Orange Dye oder 30 %-ige Saccharose-Lösung verwendet. Abbildung 2.1 Verwendete Molekulargewichtsstandards der Fa. Fermentas Abgebildet sind die in dieser Arbeit verwendeten Molekulargewichtsstandards der Fa. Fermentas. 2.1.1.1 Testgele Zur qualitativen Überprüfung von DNA-Proben wurde die vertikale GENterphorese™- Kammer der Fa. GENterprise (Mainz, Deutschland) verwendet. Die Elektrophorese erfolgte in Gelen (7 cm x 6,5 cm x 0,1 cm) mit Agarosekonzentrationen von 0,8 % bis 2 % in 1 x TBE- Puffer im TBE-Puffer-System bei 100 bis 150 mA für 30 bis 45 min. Als Molekulargewichts- standards wurden 2 µl der oben genannten Marker verwendet. Im Anschluss an die Elektrophorese wurden die Gele für 3 min in einer Ethidiumbromid-(EtBr)-Färbelösung (5 µg/ml in 1 x E-Puffer) inkubiert, kurz gewässert und auf einem Transilluminator der Fa. Bachofer (Reutlingen, Deutschland) bei 312 nm sichtbar gemacht. Die Dokumentation der 21 MATERIAL UND METHODE Gele erfolgte über das Carestream Gel Logic 112 System (Carestream Health, Rochester, USA). Alle in dieser Arbeit gezeigten Gelbilder sind invertiert dargestellt. 2.1.1.2 Analytische/präparative Gele Zur besseren Auftrennung von DNA-Fragmenten aufgrund einer längeren Laufstrecke wurde die Elektrophorese in vertikalen „Maxi“-Gelkassetten angewendet. Die „Maxi“-Gele (18 cm x 13 cm x 0,4 cm) wurden hierfür mit einer Agarosekonzentration von 0,8 % bis 1,5 % in 1 x E-Puffer bzw. 1 x TBE-Puffer hergestellt. Die Auftrennung erfolgte in einem speziellen Natriumphosphatpuffer-System (E-Puffer) bei 15 mA für 16 bis 20 h (Über-Nacht- Gele) oder im TBE-Puffer-System bei 30 mA für 3 bis 4 h (Über-Tag-Gele). Als Molekulargewichtsstandards wurden 4 µl der zuvor genannten Marker eingesetzt. Zur besseren Auftrennung kleinerer DNA-Fragmente (unter 1000 bp) wurden vertikale „Midi“- Gele (10,4 cm x 10,2 cm x 0,4 cm) mit einer Agarosekonzentration von 1 bis 2 % in 1 x TBE- Puffer verwendet. Die Auftrennung erfolgte bei 25 mA für 1 bis 2 h. Um größere DNA- Mengen (> 10 µg) gelelektrophoretisch aufzutrennen, beispielsweise bei der Größenfraktionierung zur BAC-Bank-Herstellung, wurde das „Horizontal System for Submerged Gel Electrophoresis“ der Fa. GIBCO/BRL, heute Life Technologies (Gaithersburg, USA), verwendet. Diese horizontalen „Mega“-Gele (25 cm x 20 cm x 0,7 cm) wurden mit einer Agarosekonzentration von 0,6 % in 1 x E-Puffer hergestellt. Die Parameter für die Auftrennung waren 100 mA für 16 bis 20 h in 1 x E-Puffer. Als Molekulargewichtsstandards wurden 10 µl Lambda/HindIII eingesetzt. Zur Auftrennung von sehr kleinen DNA- Fragmenten (< 200 bp) sowie zur parallelen Auftrennung vieler Proben (96-iger Format) wurde das horizontale Gelelektrophorese System „Sunrise 96“ der Fa. GIBCO/BRL, heute Life Technologies (Gaithersburg, USA), verwendet. Die Gele (24 cm x 12,5 cm x 0,5 cm) wurden mit Agarosekonzentrationen von 1 % bis 5 % in 1 x TBE hergestellt. Die Parameter eines Laufs waren 100 mA für 2 bis 3 h. 2.1.2 Wiedergewinnung von DNA-Fragmenten aus Agarosegelen 2.1.2.1 Wiedergewinnung durch Elektroelution Der gewünschte DNA-Bereich wurde mittels Skalpell aus dem präparativen Gel ausgeschnitten und das entsprechende Gelstück mit 600 µl 0,5 x TBE in einen Dialyseschlauch der Fa. Medicell International (London, UK) überführt. Der Dialyseschlauch wurde mittels Kunststoff-Clips luftblasenfrei verschlossen und in eine Elektrophoresekammer mit 0,5 x TBE gelegt, die zur Kühlung auf Eis stand. Die 22 MATERIAL UND METHODE Elektroelution erfolgte für 2 h bei 100 mA. Um am Schlauch haftende DNA wieder in Lösung zu bringen, wurde die Polung für 5 min umgekehrt und anschließend für 1 min wieder in die ursprüngliche Richtung gestellt. Dieser Schritt wurde zweimal wiederholt. Die gelöste DNA wurde aus dem Dialyseschlauch in ein 2 ml Eppendorfgefäß überführt und der Dialyseschlauch mit 300 µl 0,5 x TBE nachgespült. Der Puffer aus dem Dialyseschlauch wurde mit dem ersten Eluat vereint. 2.1.2.2 Wiedergewinnung mittels Kit Die DNA wurde mit dem NucleoSpin® Extract II Kit der Fa. Macherey-Nagel (Düren, Deutschland) nach dem Protokoll „DNA extraction from agarose gels“ nach Angaben des Herstellers wiedergewonnen. Dieses Kit fand vor allem bei der Wiedergewinnung von PCR- Produkten aus präparativen Agarosegelen Anwendung. 2.1.3 Phenol-Chloroform-Extraktion Die Methode der Extraktion mit Phenol, Chloroform und Isoamylalkohol (PCI, 25:24:1; v:v:v) dient zur Abtrennung von Proteinen. Dazu wurden die Proben mit gleichem Volumen PCI versetzt und nach fünfminütigem Invertieren in der Mikroliterzentrifuge Mikro 200 der Fa. Hettich (Tuttlingen, Deutschland) zur Phasentrennung zentrifugiert (RT, 14000 Upm, 10 min). Die obere Nukleinsäure-haltige Phase wurde in ein neues Reaktionsgefäß überführt. Zur Entfernung von Phenolresten wurde 1 Volumen Chloroform-Isoamylalkohol (CI, 24:1; v:v) zugegeben, invertiert und erneut zentrifugiert. Abschließend wurde die obere, wässrige Phase abgezogen und in ein neues Reaktionsgefäß überführt. 2.1.4 Fällung von DNA Die Fällung der DNA dient dem Reduzieren des Volumens sowie der Entfernung von Salzrückständen (Sambrook et al. 1989). Die DNA-Lösung wurde mit 1/10 Volumen 10 x Dialysepuffer versetzt und gut gemischt. Anschließend wurde das 2 bis 2,5-fache Volumen Ethanol abs. hinzugegeben und invertiert. Es folgte eine Inkubation bei -20 °C für mindestens 1 h. Durch die anschließende Zentrifugation in der Kühlzentrifuge 5804R der Fa. Eppendorf (Hamburg, Deutschland) bei 4 °C, 14000 Upm für mindestens 30 min wurde die ausgefällte DNA präzipitiert. Der Überstand wurde verworfen und die DNA durch Zugabe von 70 %-igem Ethanol und Zentrifugation in der Mikroliterzentrifuge Mikro 200 der Fa. Hettich (Tuttlingen, Deutschland) bei RT, 14000 Upm für 5 min gewaschen. Der Überstand 23 MATERIAL UND METHODE wurde erneut verworfen und das DNA-Pellet luftgetrocknet. Das trockene DNA-Pellet wurde in HPLC-H2O gelöst. 2.1.5 Polymerase-Ketten-Reaktion (PCR) 2.1.5.1 Standard PCR Die Polymerase-Ketten-Reaktion ist eine Methode zur Amplifikation eines spezifischen DNA-Abschnittes (Mullis et al. 1992). Die PCRs wurden mit der GoTaq® DNA Polymerase (Promega, Madison, USA) in einem TProfessional Thermocycler (Biometra, Göttingen, Deutschland) durchgeführt. Alle in dieser Arbeit verwendeten Primer wurden von Life Technologies (Darmstadt, Deutschland) bezogen. Eine Liste der in dieser Arbeit verwendeten Primer befindet sich im elektronischen Anhang. Ein beispielhafter PCR-Ansatz sowie das entsprechende Programm sind den Tabellen 2.1 und 2.2 zu entnehmen. Tabelle 2.1 Standard PCR-Ansatz Tabelle 2.2 PCR-Programm 5x GoTaq® Flexi Puffer 10 µl Initiale 94 °C 4:00 min MgCl2 (25 mM) 4 µl Denaturierung dNTPs (10 mM each) 1 µl Denaturierung 94 °C 0:30 min Forward Primer (0,01 mM) 2 µl Annealing 56 - 65 °C 0:30 min 40 x Reverse Primer (0,01 mM) 2 µl Elongation 72 °C 1 min/kb GoTaq® DNA Polymerase (5 U/µl) 0,2 µl Finale 72 °C 10 min Template DNA (20 ng/µl) 1 µl Elongation HPLC-H2O 29,8 µl 4 °C ∞ Gesamtvolumen 50 µl 2.1.5.2 „long range“ PCR Die „long range“ PCRs (lr-PCR) wurden mit der TaKaRa LA Taq® Hot Start Version (TaKaRa, Otsu, Japan) durchgeführt. Der PCR-Ansatz sowie das PCR-Programm sind in den Tabellen 2.3 und 2.4 aufgeführt. Die PCRs wurden in einem TProfessional Thermocycler (Biometra, Göttingen, Deutschland) durchgeführt. Tabelle 2.3 „long range“ PCR-Ansatz Tabelle 2.4 „long range“ PCR-Programm 10x LA PCR Buffer 5 µl Initiale 94 °C 1:00 min dNTPs (2,5 mM each) 8 µl Denaturierung Forward Primer (0,01 mM) 2 µl Denaturierung 94 °C 0:30 min Reverse Primer (0,01 mM) 2 µl Annealing 58 - 68 °C 0:30 min 40 x TaKaRa LA Taq® HS (5 U/µl) 0,2 µl Elongation 68 °C 1 min/kb Template DNA (20 ng/µl) 2 µl Finale 72 °C 10 min HPLC-H2O 30,8 µl Elongation Gesamtvolumen 50 µl 10 °C ∞ 24 MATERIAL UND METHODE 2.1.6 Aufreinigung von PCR-Produkten Um überschüssige Primer und Nukleotide, die bei Folgereaktionen stören könnten, zu entfernen, wurden die PCR-Ansätze mit dem Kit NucleoSpin® Extract II Kit der Fa. Macherey-Nagel (Düren, Deutschland) aufgereinigt. Es wurde das Protokoll „PCR clean up“ nach Angaben des Herstellers durchgeführt. 2.1.7 Klonierung von PCR-Produkten 2.1.7.1 pGEM®-T Easy Vector Für die Klonierung von PCR-Produkten wurde das „pGEM®-T (Easy) Vector System“ der Fa. Promega (Madison, USA) verwendet (Vektorkarte siehe Anhang A1). Die Durchführung erfolgte nach Angaben des Herstellers. Die Integratgröße konnte durch einen Verdau mit den Enzymen EcoRI (pGEM®-T Easy Vector) oder SacI und SacII (pGEM®-T Vector) und anschließender gelelektrophoretischer Auftrennung überprüft werden. Die Sequenzierung erfolgte mit den Primern Sp6 und T7. 2.1.7.2 pCR™ 4-TOPO® Vector Für große PCR-Produkte, bspw. die lr-PCR-Produkte, sowie bei schwierig zu klonierenden PCR-Produkten wurde das „TOPO® TA Cloning® Kit for Sequencing“ von Invitrogen™ (Carlsbad, USA) verwendet (Vektorkarte siehe Anhang A1). Die Durchführung erfolgte nach Angaben des Herstellers. 2.1.8 Southern Blot Beim Southern Blot wird gelelektrophoretisch aufgetrennte DNA auf einer Membran fixiert, um diese anschließend mit markierten Sonden zu hybridisieren und somit spezifisch einzelne DNA-Fragmente nachzuweisen (Southern 1975). 2.1.8.1 Restriktion genomischer DNA Genomische DNA wurde mit verschiedenen Restriktionsenzymen möglichst vollständig geschnitten. Die enzymatischen Reaktionen wurden in einem Volumen von 200 µl für insgesamt 20 h bei 37 °C durchgeführt. Eine Ausnahme bildeten Ansätze mit Sau3AI; diese wurden aufgrund der hohen Aktivität der Restriktionsendonuklease nur 1,5 h bei 37 °C inkubiert. Mittels Testgel wurden die Verdaus auf Vollständigkeit überprüft. Abschließend erfolgte eine Ethanol-Fällung. 25 MATERIAL UND METHODE 2.1.8.2 Southern Transfer Die gefällten Restriktionsansätze wurden elektrophoretisch auf einem Über-Tag-Gel aufgetrennt. Das Gel wurde anschließend mit EtBr angefärbt und dokumentiert. Die Markerbanden wurden mit einem Spatel durchgestochen. Anschließend wurde das Gel in Denaturierungslösung (0,5 M NaOH/1,5 M NaCl) für 15 min bei RT inkubiert. Nach kurzem Wässern wurde es in Neutralisierungslösung (3 M NaCl/0,5 M Tris pH 7,0) überführt und dort für 20 min bei RT inkubiert. Der Transfer der DNA auf Nitrozellulosemembranen (Protran® BA85 der Fa. Whatman®, New Jersey, USA) erfolgte ü.N. uni- oder bidirektional. Beim Sandwichblots (bidirektional) ist das Gel umgeben von in 2 x SSC angefeuchteten Nitrozellulosemembranen, gefolgt von drei Lagen ebenfalls in 2 x SSC angefeuchtetem Whatman 3MM-Papier. Umschlossen werden diese von etwa 5 cm hohen Stapeln an Papierhandtüchern. Eine Plexiglasplatte und ein weiteres Gewicht beschweren die komplette Konstruktion. Beim unidirektionalen Blot liegt das Gel auf Whatman 3MM- Papier, dessen Enden in ein Reservoir an 20 x SSC reichen. Auf dem Gel liegt die Nitrozellulosemembran, gefolgt von vier Lagen in 2 x SSC angefeuchtetem Whatman 3MM- Papier und einem etwa 5 cm hohem Stapel an Papierhandtüchern. Nach erfolgtem Transfer wurden die Nitrozellulosemembranen kurz in 2 x SSC gewaschen. Mit einem Fettstift konnten unter UV-Licht die Probentaschen, die Gelumrisse sowie die Banden des Markers auf der Nitrozellulosemembran markiert werden, ehe diese zum Fixieren der DNA bei 80 °C für 2 h inkubiert wurden. 2.1.8.3 Hybridisierung Die Hybridisierung des Southern Blots (Meinkoth und Wahl 1984) erfolgte mit einer radioaktiv markierten Sonde (siehe 2.3.1.1). Die Blot-Filter wurden in Präinkubationsmedium nach Denhardt (1966) für 3 h bei 60 °C inkubiert. Die Hybridisierungslösung aus radioaktiv markierter Sonde, „Carrier“-DNA und Hybridisierungspuffer wurde durch Erhitzen denaturiert (10 min, 95 °C) und anschließend rasch in Eiswasser abgekühlt. Die Hybridisierung erfolgte in Glas-Hybridisierungsröhren ü.N. bei 60 °C im Hybridisierungsofen. Nach Abgießen der Hybridisierungslösung wurden die Membranen mit 2 x SSC bei 60 °C für 30 min gewaschen. Dieser Waschschritt wurde zweimal wiederholt. Abschließend wurden die Filter kurz in 2 x SSC bei RT gewaschen, auf Filterpapier getrocknet und auf 3MM-Filterpapier fixiert mit Haushaltsfolie glatt abgedeckt. 26 MATERIAL UND METHODE 2.1.8.4 Autoradiografie Das radioaktive Isotop 32P emittiert ß-Teilchen. Diese bewirken eine Schwärzung eines Röntgenfilms. Die Verwendung einer Verstärkerfolie verkürzt die Expositionszeit bei einer Temperatur von -80 °C. Die Expositionszeit liegt je nach Strahlungsintensität zwischen 2 h und einer Woche. Der Röntgenfilm wurde für die Entwicklung für 4 min in Entwicklerlösung inkubiert, anschließend kurz gewässert und dann für 4 min in Fixierlösung getaucht. Abschließend wurde der Film gewässert und getrocknet. 2.1.9 „Pirotta“ Blot Der „Pirotta“ Blot wird auch als reverser Southern Blot bezeichnet und dient der Identifizierung von Sonden mit hoch- bzw. mittelrepetitiven Elementen (Buhariwalla et al. 1995). Im Gegensatz zum Southern Blot wird nicht die genomische DNA, sondern die Sonde auf einer Nitrozellulosemembran fixiert. Diese wird anschließend mit radioaktiv markierter genomischer DNA hybridisiert. Die Durchführung entsprach ansonsten der des Southern Blots (siehe 2.1.8). 2.2 Konstruktion einer Apfel-BAC-Bibliothek 2.2.1 Versuchsmaterial Als Ausgangsmaterial dienten in-vitro-Kulturen der kolumnar-wüchsigen Apfelsorte P28. P28 stammt aus Kreuzungen der kolumnaren Sorte Flamenco und der normal-wüchsigen Sorte Topaz. Das Material stellte die Universität Geisenheim zu Verfügung. 2.2.2 Isolation von Zellkernen Die Isolation der Zellkerne erfolgte nach einem modifizierten Protokoll von L.A. Burgoyne (Burgoyne et al. 1970). Zunächst wurde das Ausgangsmaterial (etwa 1,5 g) mittels Skalpell zerkleinert und in 10 ml Homogenisierungspuffer aufgenommen. Dieser wurde zuvor mit 1/10 Volumen 10 %-igem Triton X-100 versetzt. Die Verwendung von Triton X-100 dient dem chemischen Zellaufschluss und bewirkt zudem, dass die isolierten Zellkerne keine äußere Membran mehr besitzen (Blobel und Potter 1966). Der mechanische Zellaufschluss erfolgte in einem Homogenisator für 15 min auf Eis. Anschließend wurde das Gemisch über Gaze filtriert. Der Filterkuchen wurde erneut in 10 ml Homogenisierungspuffer aufgenommen, homogenisiert und filtriert. Die Filtrate wurden vereinigt. In einem Zentrifugenbecher wurde Lösung 1 vorgelegt und mit dem Filtrat überschichtet. Das 27 MATERIAL UND METHODE Volumenverhältnis betrug 1:1. Es wurde für 20 min bei 4 °C und 14000 Upm in der Kühlzentrifuge 3K30 der Fa. Sigma (Osterode am Harz, Deutschland) zentrifugiert. Der Überstand wurde verworfen und das Pellet in 2,5 ml Lösung 2 resuspendiert. In zwei Ultrazentrifugen-Tubes wurden jeweils 650 µl Lösung 2 vorgelegt und mit der Suspension im Verhältnis 1:2 überschichtet. Es folgte ein Zentrifugationsschritt bei 35000 Upm und 4 °C für 1,5 h in der Ultrazentrifuge Sorvall Discovery M120SE der Fa. Thermo Scientific (Waltham, USA). Die Überstände wurden verworfen und die Pellets in je 300 µl L-Puffer aufgenommen. Bei zeitnaher Verwendung erfolgte die Lagerung bei 4 °C, ansonsten wurden die Suspensionen bei -20 °C gelagert. Als Alternative zum Homogenisator erfolgte der mechanische Zellaufschluss mit einem Stabmixer. Etwa 30 g Ausgangsmaterial wurden unter Zugabe von 40 ml mit 10%-igem Triton X-100 versetzten Homogenisierungspuffer in einem vorgekühlten 1-Liter-Becherglas auf Eis mittels Stabmixer zerkleinert. Das Gemisch wurde über Gaze filtriert und der Filterkuchen in 40 ml Homogenisierungspuffer aufgenommen, erneut zerkleinert und filtriert. Dieser Schritt wurde ein weiteres Mal wiederholt. Die Filtrate wurden vereinigt. Aufgrund des hohen Volumens (insgesamt 120 ml) wurden die folgenden, oben beschriebenen Zentrifugationsschritte sechs Mal parallel durchgeführt. Als zweite Alternative wurden die in-vitro-Kulturen unter flüssigem Stickstoff mit Mörser und Pistill zerkleinert. Das weitere Vorgehen entspricht dem Ansatz bei Verwendung eines Homogenisators. 2.2.3 Kern-Lyse und Proteinase K-Verdau Die Zellkern-Suspensionen wurden mit je 80 µl 10 %-iger SDS-Lösung und je einer Spatelspitze Proteinase K versetzt und bei 60 °C für 10 min inkubiert. Anschließend erfolgte eine Inkubation bei 37 °C für 60 min. Die einzelnen Ansätze wurden vereint und ü.N. gegen autoklaviertes VE-Wasser dialysiert, um die Proteinase K zu verdünnen und SDS zu entfernen. Zum Entfernen der Proteine und die damit verbundene Aufreinigung der DNA wurden zwei PCI- und zwei CI-Extraktionen durchgeführt (siehe 2.1.3). 1/250 des Probenvolumens wurde zur Überprüfung auf Qualität und Quantität der DNA auf ein 1 %-iges Über-Tag-Gel aufgetragen. 2.2.4 Restriktion Mittels Restriktionsendonukleasen kann die DNA an definierten Stellen geschnitten werden. Die DNA sollte jedoch nicht vollständig restringiert werden, da für die Konstruktion 28 MATERIAL UND METHODE einer BAC-Bibliothek möglichst große DNA-Fragmente benötigt werden. Allerdings muss gewährleistet sein, dass durch den Verdau genügend passende Enden generiert werden, um eine Ligation mit pBeloBAC11 zu ermöglichen. Aus diesem Grund erfolgte die Restriktion in einem großen Volumen bei kurzer Inkubationszeit und geringer Enzymkonzentration. Die Restriktion wurde in Ansätzen zu je 5 ml durchgeführt. Dazu wurden 4,5 ml DNA-Lösung mit 500 µl Restriktionspuffer A und 1 µl des Enzyms Sau3AI (1 U/µl, Roche Diagnostics, Mannheim, Deutschland) versetzt. Die Inkubation erfolgte bei 37 °C. Pro Durchgang wurden ein Ansatz mit 1 min, zwei Ansätze mit 1,5 min und ein Ansatz mit 2 min Restriktionsdauer angesetzt. Da das Enzym weder mit EDTA noch mittels Hitze inaktiviert werden kann, wurde im Anschluss eine PCI-Extraktion durchgeführt. 1/250 des Probenvolumens wurden zur Überprüfung der Restriktion auf ein 1 %-iges Über-Tag-Gel aufgetragen. Bei erfolgreicher Restriktion wurden die verschiedenen Ansätze vereint und durch Wasserentzug mittels PEG auf etwa 3 ml eingeengt. 2.2.5 Größenfraktionierung Die gelelektrophoretische Auftrennung von DNA ist Grundlage dieser Methode, bei der kleine DNA-Fragmente (< 23 kb) von der gewünschten hochmolekularen DNA abgetrennt werden. Für ein effektives Abtrennen der kleinen Fragmente waren zwei aufeinanderfolgende Größenfraktionierungen erforderlich. Für die erste Größenfraktionierung wurden 0,8 %-ige Über-Nacht-Gele in einem speziellen Natriumphosphatpuffer-System (E-Puffer) verwendet. Die Proben wurden vor dem Auftragen für 5 Minuten auf 65 °C erhitzt, um kleine DNA-Fragmente, die an den großen DNA-Molekülen anhaften, zu lösen. Nach Ende der Gelelektrophorese wurden die an den Rändern aufgetragenen Markerspuren mit einem geringen Teil der präparativen Spur mittels Skalpell abgeschnitten und mit EtBr angefärbt. Unter UV-Licht wurde der gewünschte Bereich (> 23 kb) markiert. Anschließend wurde das Gel wieder zusammengesetzt und der markierte Bereich in der präparativen Spur „blind“ ausgeschnitten. Dadurch verhinderte man ein Anfärben der DNA mit EtBr, sowie eine mögliche Schädigung der DNA durch UV-Strahlung. Der präparative Teil des Gels wurde erst nach dem Ausschneiden der Banden angefärbt und dokumentiert. Die DNA im ausgeschnittenen Agarose-Stück wurde mittels Elektroelution wiedergewonnen (siehe 2.1.2.1). Die eluierte DNA wurde zur zweiten Größenfraktionierung erneut auf ein 0,8 %-iges Über-Nacht-Gel aufgetragen. Die zweite Fraktionierung entsprach in der 29 MATERIAL UND METHODE Methodik der ersten. Als Alternative zu den Über-Nacht-Gelen wurde das „Horizontal System for Submerged Gel Electrophoresis“ der Fa. GIBCO/BRL, heute Life Technologies (Gaithersburg, USA), verwendet. Die Durchführung entsprach ansonsten der Größenfraktionierung mittels Über-Nacht-Geles. Ein „Mega“-Gel ersetzte bis zu 25 Über- Nacht-Gele. 2.2.6 Test zur Überprüfung der Integrat-Enden Vor der Ligation sollte überprüft werden, ob die Restriktion mit Sau3AI erfolgreich war und die überhängenden einzelsträngigen DNA-Enden trotz zweier Größenfraktionierungen intakt waren. Abbildung 2.2 zeigt die palindromische Restriktionsschnittstelle des Enzyms. Abbildung 2.2 Restriktionsschnittstelle Sau3AI Um zu überprüfen, ob die Integrat-Enden intakt waren, wurden vier verschiedene Endfilling-Reaktionen angesetzt (Tabelle 2.5). Dabei wurden teilweise radioaktiv markierte Nukleotide verwendet. Nach einer Ethanolfällung konnte mittels Geiger-Müller-Zähler überprüft werden, ob die radioaktiv markierten Nukleotide eingebaut wurden und die Überhänge demnach intakt waren. Die Reaktion erfolgte bei RT für 30 min, zum Abstoppen wurde für 5 min bei 65 °C inkubiert. Tabelle 2.5 Endfilling (radioaktiv) Ansatz A* Ansatz GA* DNA-Lösung 10 µl DNA-Lösung 10 µl 10 x Klenow-Puffer 3 µl 10 x Klenow-Puffer 3 µl Klenow-Fragment 2,5 µl Klenow-Fragment 2,5 µl HPLC-H2O 12,5 µl HPLC-H2O 11,5 µl 32 α- P-dATP 2 µl dGTP 1 µl 32 α- P-dATP 2 µl Ansatz GATC* Ansatz GA*TC* DNA-Lösung 10 µl DNA-Lösung 10 µl 10 x Klenow-Puffer 3 µl 10 x Klenow-Puffer 3 µl Klenow-Fragment 2,5 µl Klenow-Fragment 2,5 µl HPLC-H2O 9,5 µl HPLC-H2O 8,5 µl dGTP 1 µl dGTP 1 µl 32 dATP 1 µl α- P-dATP 2 µl dTTP 1 µl dTTP 1 µl 32 32 α- P-dCTP 2 µl α- P-dCTP 2 µl Klenow-Puffer und Klenow-Fragment (NEB, Frankfurt am Main, Deutschland) Nukleotide (Roche Diagnostics, Mannheim, Deutschland) radioaktiv markierte Nukleotide (Hartmann Analytic, Braunschweig, Deutschland) 30 MATERIAL UND METHODE 2.2.7 Ligation Für die Ligation wurde das Enzym T4 DNA Ligase (Roche Diagnostics, Mannheim) verwendet. Als Vektor diente mit dem Restriktionsenzym BamHI geschnittener und AP- behandelter pBeloBAC11 (Shizuya et al. (1992), Vektorkarte siehe Anhang A1). Der fertig behandelte Vektor wurde von Thomas Herold (2012) bereitgestellt. Die Ligation erfolgte mindestens ü.N. bei RT. Ein Ligationsansatz ist Tabelle 2.6 zu entnehmen. Tabelle 2.6 Ligationsansatz DNA-Lösung 15 µl pBeloBAC11 1 µl 10 x DNA Ligase Puffer 2 µl T4 DNA Ligase 2 µl Gesamtvolumen 20 µl 10 x DNA Ligase Puffer u. T4 DNA Ligase (Roche Diagnostics, Mannheim, Deutschland) Anschließend wurde der Ligationsansatz gefällt und das Pellet in 20 µl HPLC-H2O gelöst. Die Nomenklatur der Ligationen (L) ergab sich aus dem Ausgangsmaterial, der Art der Größenfraktionierung (bspw. „M“ für „Mega“-Gel) und einer fortlaufenden Nummer. Beispielsweise erhielt die zweite Ligation aus P28 in-vitro-Kulturen mit Größenfraktionierungen über „Mega“-Gele den Namen P28ivML2. Die Nomenklatur der Ligationen wurde auf die daraus resultierende DNA-Bibliothek übertragen. 2.2.8 Transformation mittels Elektroporation Mit der Methode der Elektroporation können rekombinante Plasmide in elektrokompetente Zellen transformiert werden (Dower et al. 1988). Für die Transformation wurden 2 µl des Ligationsansatzes zu 40 µl der elektrokompetenten Zellen gegeben und in eine gekühlte Küvette (Gene Pulser® Cuvette) mit einer Spaltbreite von 0,1 cm der Fa. Bio-Rad Laboratories (Hercules, USA) überführt. Die Transformation erfolgte bei 1,8 kV im Elektroporator Micro PulserTM der Fa. Bio-Rad (München, Deutschland) für 3-5 ms. Nach der Transformation wurde umgehend 1 ml vorgewärmtes SOC-Medium (Sambrook et al. 1989) zu den Zellen gegeben und diese darin resuspendiert. Es folgte eine Inkubation unter Schütteln in einem 15 ml-Reaktionsgefäß bei 37 °C für 1 h. Im Anschluss wurden pro Agarplatte 250 µl des Transformationsansatzes ausplattiert und für 16 bis 20 h bei 37 °C bebrütet. Die bewachsenen Agarplatten wurden bei 4 °C gelagert. 31 MATERIAL UND METHODE 2.2.9 Herstellung elektrokompetenter Zellen Für die Herstellung elektrokompetenter Zellen wurden 50 ml LB-Medium mit einer Einzelkolonie des E. coli-Stammes DH10B (Grant et al. 1990) angeimpft und unter Schütteln bei 37 °C ü.N. inkubiert. Im Anschluss wurden 10 ml der Kultur in 500 ml LB-Medium überimpft (insgesamt 4 Ansätze) und erneut unter Schütteln bei 37 °C inkubiert, bis mithilfe des BioPhotometers der Fa. Eppendorf (Hamburg, Deutschland) eine OD600 von 0,71 bis 0,72 ermittelt wurde. War dieser Wert erreicht, wurden die Bakterienkulturen für 45 min auf Eis inkubiert. Es folgte eine Zentrifugation (4 °C, 2500 Upm, 15 min) in vorgekühlten 500 ml PET-Zentrifugenbechern in der Zentrifuge 4K15C der Fa. Sigma (Osterode am Harz, Deutschland). Anschließend wurden die Pellets in je 50 ml sterilem, eiskaltem HPLC-H2O resuspendiert, jeweils zwei Ansätze vereint und erneut zentrifugiert (4 °C, 2500 Upm, 20 min). Die Pellets wurden in 30 ml sterilem, eiskaltem HPLC-H2O resuspendiert, in vorgekühlte 80 ml Zentrifugenbecher überführt und in der Kühlzentrifuge 3K30 der Fa. Sigma (Osterode am Harz, Deutschland) zentrifugiert (4 °C, 2500 Upm, 20 min). Die Pellets wurden in je 5 ml eiskaltem 10 %-igem Glycerin resuspendiert und erneut zentrifugiert (s.o.). Der Überstand wurde sorgfältig abgeschüttet und die Pellets im verbleibenden restlichen Überstand resuspendiert und anschließend vereint. Im Anschluss wurden die elektrokompetenten DH10B-Zellen aliquotiert. Hierfür wurden je 40 µl Aliquots in bei -80 °C vorgekühlte 1,5 ml Eppendorfgefäße auf Eis überführt. Die kompetenten Zellen wurden bei -80 °C gelagert. 2.2.10 BAC-Minipräparation Um die statistische Genomabdeckung einer BAC-Bibliothek zu ermitteln, wurde ein Restriktionsverdau zur Integratgrößenbestimmung einiger zufällig ausgewählter Plasmide durchgeführt. Die BAC-Minipräparation dient zur Isolierung von Plasmiden (modifiziert nach Sheng et al./Whitehead). Die gewünschte Kolonie wurde in 5 ml L-Medium ü.N. bei 37 °C angezogen. Die ü.N.-Kultur wurde in der Kühlzentrifuge 4K15C der Fa. Sigma (Osterode am Harz, Deutschland) bei RT mit 5000 Upm für 20 min zentrifugiert und der Überstand verworfen. Das Pellet wurde in 100 µl kalter Lösung 1 resuspendiert. Nach Zugabe von 1 µl RNaseH (Peqlab, Erlangen, Deutschland) wurde die Lösung in ein 1,5 ml-Eppendorfgefäß überführt und auf Eis für 2 min inkubiert. Anschließend wurden 200 µl Lösung 2 hinzugegeben und 8 bis 10-mal invertiert. Nach Zugabe von 150 µl eiskalter Lösung 3 wurde erneut invertiert und 10 min auf Eis inkubiert. Des Weiteren wurde die Probe für 10 min bei 32 MATERIAL UND METHODE 14000 Upm und RT in der Mikroliterzentrifuge Mikro 200 der Fa. Hettich (Tuttlingen, Deutschland) zentrifugiert. Der Überstand wurde in ein neues 1,5 ml-Eppendorfgefäß überführt und der Zentrifugationsschritt wiederholt. Es folgte eine Fällung mit 300 µl Isopropanol und anschließender Zentrifugation in der Mikroliterzentrifuge Mikro 200 der Fa. Hettich (Tuttlingen, Deutschland) bei RT und 14000 Upm für 15 min. Der Überstand wurde verworfen, das Pellet in 300 µl TE-Puffer gelöst. Nach Zugabe von 150 µl 7,5 M Kaliumacetat-Lösung wurde die Lösung für mindestens 15 min bei –80 °C inkubiert. Die aufgetaute Probe wurde in der Mikroliterzentrifuge Mikro 200 der Fa. Hettich (Tuttlingen, Deutschland) zentrifugiert (RT, 14000 Upm, 10 min). Der Überstand wurde mit 900 µl Ethanol abs. gefällt. Nach abschließender Zentrifugation (s.o.) wurde der Überstand verworfen, das Pellet getrocknet und in 20 µl HPLC-H2O aufgenommen. Für die Restriktion wurde der in Tabelle 2.7 abgebildete Ansatz pipettiert und bei 37 °C für mindestens 4 h inkubiert. Der Restriktionsansatz wurde komplett auf ein 1 %-iges Über-Tag-Gel aufgetragen. Tabelle 2.7 Restriktionsansatz BAC-Minipräparation Plasmid-Lösung 10 µl 10 x RE-Puffer 2 µl Acetyliertes BSA 0,2 µl Restriktionsenzym EcoRI (12 U/µl) 1 µl HPLC-H2O 6,8 µl Gesamtvolumen 20 µl RE Puffer, EcoRI und BSA (Promega, Madison, USA) 2.3 Screening einer Apfel-BAC-Bank Das Verfahren der Koloniefilter-Hybridisierung nach Grunstein und Hogness (1975) dient der Identifizierung von Bakterienklonen, die einen Klonierungsvektor mit dem eingebauten, gesuchten DNA-Abschnitt enthalten. 2.3.1 Konstruktion PCR-basierender Sonden Die Transkriptomdaten der Apfelsorten P28 und A14 des Roche-454- und des Illumina- Laufes von Clemens Krost (2012) dienten als Ausgangssequenzen zur Konstruktion der Sonden in der Zielregion. Durch BLASTn-Suchen gegen das veröffentlichte Apfelgenom (Velasco et al. 2010) wurden diejenigen Contigs der Transkriptomdaten identifiziert, die in der Zielregion liegen. Diese Contigs wurden mit dem Programm Spidey (NCBI) auf Exongrenzen untersucht, um möglichst große Exons (> 300 bp) zu finden. Durch das Entwerfen spezifischer PCR-Primer in diesen Exonbereichen konnten „single-copy“-Sonden 33 MATERIAL UND METHODE erstellt werden. Anhand von Southern und „Pirotta“ Blot-Analysen wurden die PCR- Produkte abschließend auf repetitive Elemente untersucht (siehe Kapitel 2.1.7 u. 2.1.8). In Bereichen der Zielregion, die nicht von den Transkriptomdaten abgedeckt waren, wurden die Sequenzinformationen des veröffentlichten Genoms zur Herstellung PCR-basierender Sonden genutzt. 2.3.1.1 Random Primed Oligo Labeling Dieses Verfahren beschreibt die Hybridisierung von Oligonukleotiden zufälliger Sequenz an eine einzelsträngige Matrizen-DNA und die anschließende Elongation durch das Klenow- Fragment unter Einbau radioaktiv markierter Nukleotide (Feinberg und Vogelstein 1983). Zur radioaktiven Markierung mit α-32P-dATP (10 µCi/µl) wurde das Random Primed DNA Labeling Kit der Fa. Roche Diagnostics (Mannheim, Deutschland) nach Angaben des Herstellers verwendet. Das Labeling erfolgte mit 7 µl α-32P-dATP bei 37 °C für 1,5 h. Abschließend wurde die DNA gefällt, der Einbau des radioaktiv markierten Nukleotids mittels Geiger-Müller-Zähler überprüft und das Pellet in 100 µl HPLC-H2O gelöst. 2.3.2 Koloniefilter-Hybridisierung 2.3.2.1 Vorbereitung der Filter Auf die Agarplatten der Transformation wurden Nitrozellulose-Filter (Protran® BA85 der Fa. Whatman®, New Jersey, USA) gelegt und mit einer Impfnadel asymmetrische Markierungen zur späteren Orientierung auf dem Filter angebracht. Die Filter wurden für 7 min auf mit 0,5 M NaOH getränktes Filterpapier gelegt und anschließend getrocknet. Des Weiteren wurden die Filter für 5 min auf mit 1,5 M Tris pH 7,4 getränktes Filterpapier gelegt und danach für 5 min in 0,5 M Tris/1,5 M NaCl pH 7,4 getaucht. Im nächsten Schritt wurden die getrockneten Filter für 30 min bei RT in Proteinase K-Lösung (1 mg/ml in 1 x SSC) inkubiert. Die Filter wurden kurz durch Ethanol abs. gezogen und getrocknet. Es folgte eine Inkubation der Filter für 5 min in 0,3 M NaCl. Durch kräftiges Drücken der nassen Filter zwischen Filterpapier konnten Koloniereste entfernt werden. Abschließend wurde die Plasmid-DNA durch Anbacken bei 80 °C für 2 h auf der Filtermembran fixiert. 2.3.2.2 Hybridisierung Die Hybridisierung erfolgte wie in Kapitel 2.1.8.3 beschrieben. Allerdings wurden für die Hybridisierung Petrischalen verwendet, die in eine feuchte Kammer gestellt und bei 60 °C ü.N. inkubiert wurden. Es wurde zudem nur ein Waschschritt mit vorgewärmtem 2 x SSC für 34 MATERIAL UND METHODE 5 min durchgeführt. Abschließend wurden die Filter zum Trocknen ausgelegt, auf 3MM- Filterpapier fixiert und mit Haushaltsfolie glatt abgedeckt. 2.3.2.3 Autoradiografie Die Autoradiografie wurde analog zu den Southern Blots wie in Kapitel 2.1.8.4 beschrieben durchgeführt. 2.3.2.4 Zweite Runde der Koloniefilter-Hybridisierung Da die Agarplatten oft dicht bewachsen waren, war eine Zuordnung zwischen einem Signal auf dem Autoradiogramm und der entsprechenden Kolonie auf der Agarplatte meist nicht eindeutig. Aus diesem Grund wurden alle Kolonien, welche sich im engeren Umfeld zu einem starken Signal des Autoradiogramms befanden, gepickt und auf zwei gerasterten Nitrozellulose-Filtern identisch ausgestrichen. Die Nitrozellulose-Filter wurden ü.N. bei 37 °C bebrütet. Mit einem der beiden 2. Runde-Filter wurden die Schritte unter 2.3.2.1 – 2.3.2.3 durchgeführt. Als Sonde wurde die der ersten Runde verwendet. Auf den gerasterten Filtern war eine eindeutige Zuordnung zwischen Signal des Autoradiogramms und ausgestrichener Kolonie gewährleistet. Von der unbehandelten Kopie konnten die positiven Kolonien gepickt und angezogen werden. 2.3.2.4 Randsequenzierung Um die genomische Lage eines BAC-Klons zu bestimmen, wurden die Ränder des Integrates mit den dafür vorgesehenen Primern Sp6 und T7 nach Sanger et al. (1977) sequenziert. Die Sequenzierungen wurden von der Fa. GENterprise (Mainz, Deutschland) durchgeführt. Mithilfe des Suchalgorithmus BLASTn (Altschul et al. 1990) wurde die genomische Lage der Sequenzen untersucht. Klone, die in der Zielregion lagen, wurden anschließend vollständig sequenziert. 2.4 Sequenzierung relevanter Klone mittels shotgun-Bibliotheken Diese Methode ermöglichte die Sequenzierung großer BAC-Klone. Dazu wurden die isolierten Plasmide zufällig in kleinere Fragmente zerlegt, welche wiederum kloniert und anschließend sequenziert wurden. Durch die Sequenzierung vieler dieser kleinen Fragmente konnte letztlich die komplette BAC-Sequenz zusammengesetzt werden. 35 MATERIAL UND METHODE 2.3.1 Plasmid-Isolierung nach Whitehead Das verwendete Verfahren zur Plasmid-Präparation wurde am Whitehead Institute in Massachusetts entwickelt. Zunächst wurde eine 5 ml Über-Tag-Kultur anlegt. Die Über-Tag- Kultur wurde in 500 ml antibiotikahaltiges L-Medium überführt und bei 37 °C unter Schütteln für 16 bis 18 h inkubiert (ü.N.-Kultur). Die ü.N.-Kultur wurde in ein 500 ml- Zentrifugengefäß überführt und in der Kühlzentrifuge 4K15C der Fa. Sigma (Osterode am Harz, Deutschland) zentrifugiert (4 °C, 5000 Upm, 15 min). Der Überstand wurde verworfen und das Pellet in 10 ml Lösung I resuspendiert und in einen 100 ml-Zentrifugenbecher überführt. Nach Inkubation für 5 min bei RT erfolgte die Zugabe von 20 ml Lösung II. Nach gründlichem Invertieren wurde für 10 min bei RT inkubiert. Schließlich wurden 15 ml kalte Lösung III hinzugegeben, invertiert und die Probe für 10 min auf Eis gestellt. Es folgte ein Zentrifugationsschritt in der Kühlzentrifuge 3K30 der Fa. Sigma (Osterode am Harz, Deutschland) bei 4 °C und 14000 Upm für 20 min, welcher mit dem Überstand direkt im Anschluss wiederholt wurde. Für die Isopropanol-Fällung wurde die Probe auf zwei 50 ml- Reaktionsgefäße aufgeteilt und jeweils mit 15 ml Isopropanol versetzt. Nach Zentrifugation in der Kühlzentrifuge 4K15C der Fa. Sigma (Osterode am Harz, Deutschland) bei RT mit 5000 Upm für 20 min wurden die Überstände verworfen und die Pellets in jeweils 3 ml TE- Puffer resuspendiert. Nach Zugabe von jeweils 1,5 ml 7,5 M Kaliumacetat wurden die Proben vereint und bei -80 °C für mindestens 45 min inkubiert. Die aufgetaute Probe wurde erneut zentrifugiert (s. o.), ehe der Überstand einer Ethanolfällung unterzogen wurde. Das Pellet wurde in 700 µl 50T/50E-Puffer resuspendiert. Für den anschließenden RNase- Verdau wurde 1 µl RNaseH (Peqlab, Erlangen, Deutschland) hinzugegeben und für 45 min bei 37 °C inkubiert. Es folgte eine PCI- und eine CI-Extraktion (siehe 2.1.3). Die obere Phase wurde mit 700 µl Isopropanol gefällt und in 200 µl HPLC-H2O aufgenommen. 2.3.2 Nebulisieren der Plasmid-DNA und Endfilling Das Scheren von 50 µg Plasmid-DNA erfolgte in 2 ml TE-Puffer für 25 sec bei 1 bar in einem Nebulizer der Fa. Invitrogen™ (Carlsbad, USA). Abschließend wurde die gescherte DNA- Lösung gefällt. Mittels Endfilling wurden die Enden der nebulisierten DNA-Fragmente aufgefüllt, sodass einheitliche „glatte“ Enden entstehen. Der Endfilling-Ansatz ist Tabelle 2.8 zu entnehmen. Die Reaktion erfolgte bei 37 °C für 30 min. 36 MATERIAL UND METHODE Tabelle 2.8 Endfilling-Ansatz Nebulisierte DNA-Lösung 31,5 µl 5 x T4-DNA Polymerase Puffer 10 µl dNTPs (10 mM each) 1 µl BSA (100 x) 0,5 µl Klenow Fragment (2 U/µl) 3 µl T4-DNA Polymerase (1 U/µl) 4 µl Gesamtvolumen 50 µl alle Reagenzien (Roche Diagnostics, Mannheim, Deutschland) 2.3.3 Größenfraktionierung und Elektroelution Nach erfolgtem Endfilling wurde die DNA über ein präparatives „Midi“-Gel aufgetrennt. Es wurden zwei Fraktionen ausgeschnitten (1-2 kb und 2-4 kb) und die DNA mittels Elektroelution (siehe 2.1.2.1) wiedergewonnen und gefällt. Mittels Testgel wurde die größenfraktionierte DNA überprüft. 2.3.4 Ligation und Transformation Die größenfraktionierte DNA wurde in SmaI-restringierten, AP-behandelten pUC19 kloniert. Pro Fraktion wurde eine Ligation angesetzt. Die Reaktion erfolgte für 60 h bei RT nach dem in Tabelle 2.9 zu entnehmenden Ansatz. Tabelle 2.9 Ligations-Ansatz Größenfraktionierte DNA-Lösung 6 µl 10 x Ligase Puffer 2 µl pUC19 SmaI AP 1 µl HPLC-H2O 9 µl T4-DNA Ligase (1 U/µl) 2 µl Gesamtvolumen 50 µl alle Reagenzien (Roche Diagnostics, Mannheim, Deutschland) Nach erfolgter Ligation wurden die Ansätze gefällt. Die Transformation erfolgte wie unter 2.2.8 beschrieben. Pro Ansatz wurden zweimal 100 µl und dreimal 10 µl des Transformationsansatzes auf Agarplatten ausplattiert. 2.3.5 Überprüfung der shotgun-Bibliothek und Sequenzierung Pro Transformationsansatz wurden 8 Klone gepickt und die Plasmide mit dem Kit „peqGOLD Plasmid Miniprep Kit I“ der Fa. Peqlab (Erlangen, Deutschland) nach Angaben des Herstellers isoliert. Die isolierten Plasmide wurden in 50 µl HPLC-H2O eluiert. Durch einen Restriktionsverdau und anschließende gelelektrophoretische Auftrennung wurde die 37 MATERIAL UND METHODE Integratgröße der Plasmide überprüft. Der Ansatz ist Tabelle 2.10 zu entnehmen. Die Restriktion erfolgte für 3 h bei 37 °C. Tabelle 2.10 Restriktionsansatz pUC Plasmid-Lösung 5 µl 10 x Restriktionspuffer R+ 2 µl HPLC-H2O 11 µl Restriktionsenzym HindIII (10 U/µl) 1 µl Restriktionsenzym EcoRI (12 U/µl) 1 µl Gesamtvolumen 20 µl alle Reagenzien (Fermentas, St. Leon-Rot, Deutschland) Enthielten mindestens 12 der 16 untersuchten Klone ein Integrat in erwarteter Größe, wurden pro Transformationsansatz 192, insgesamt folglich 384 Klone gepickt. Die Anzucht der Klone erfolgte in 96er-„Deep-Well“-Platten der Fa. ABgene (Epsom, UK). Hierfür wurde pro Klon 1 ml ampicillinhaltiges 2 x LB Medium vorgelegt. Die Klone wurden für 18 h bei 37 °C bebrütet. Die Plasmid-Isolierung und anschließende Sequenzierung wurden von der Fa. GENterprise (Mainz, Deutschland) durchgeführt. 2.3.6 Auswertung von DNA-Sequenzen Mit den von der Fa. GENterprise (Mainz, Deutschland) erhaltenen Sequenzdaten sollten die BAC-Klone vollständig zusammengesetzt werden. Die Editierung der Sequenzdaten (EditSeq™) und die Erstellung eines Sequenz-Alignments (SeqMan™) wurden mithilfe des Software-Pakets Lasergene® der Fa. DNASTAR Inc. (Madison, USA) durchgeführt. Einzelne Chromatogramme wurden mit dem Programm FinchTV v1.4.0 der Fa. Geospiza Inc. (Seattle, USA) visuell kontrolliert. Traten bei den Alignments Lücken oder schlecht abgedeckte Bereiche auf, so wurden diese mit speziell entworfenen Primern nochmals sequenziert. Abschließend wurde der Vektoranteil des BAC-Klons entfernt, sodass die reine Integratsequenz vorlag. 2.5 Sequenzierung von BAC-Klonen mittels Illumina Next-Generation Sequencing Sollen mehrere BAC-Klone sequenziert werden, ist die Illumina-Sequenzierung eine kostengünstigere Alternative zur Sequenzierung mittels shotgun-DNA-Bibliotheken. Da für die Illumina-Sequenzierung DNA-Mengen von 1 µg ausreichen, erfolgte die Plasmid- Isolierung nach Promega. Die Erstellung der „paired end“-Bibliotheken wurde von der Fa. GENterprise (Mainz, Deutschland) durchgeführt. Die Sequenzierung erfolgte mittels eines 38 MATERIAL UND METHODE 100 bp „paired end“-Laufs auf dem Illumina HiSeq 2000 durch das Nukleinsäure-Analyse- Zentrum (IMSB, Mainz, Deutschland). 2.5.1 Plasmid-Isolierung nach Promega Zur Plasmid-Isolierung wurde das Kit „PureYield Plasmid Maxiprep System“ der Fa. Promega (Madison, USA) verwendet. Die Durchführung erfolgte nach Angaben des Herstellers. Da es sich bei den zu isolierenden Plasmiden um BAC-Konstrukte handelte, wurde die Menge des Ausgangsmaterials von im Protokoll angegebenen 300 ml auf 450 ml erhöht. 2.5.2 Auswertung der Illumina Next-Generation Sequencing Sequenzdaten 2.5.2.1 Aufbereitung und Filterung der Rohdaten Die Aufbereitung der Rohdaten wurde mit zahlreichen Perl-Skripten umgesetzt. Diese wurden von Benjamin Rieger (IMSB) in Zusammenarbeit mit Dr. Steffen Rapp (IMSB) geschrieben. Aus Tabelle 2.11 sind die verwendeten Perl-Skripte mit einer kurzen Beschreibung zu entnehmen. Tabelle 2.11 Verwendete Perl-Skripte qseq2fastq.pl Umwandlung von „qseq“-Dateien in das „fastq“-Format bei gleichzeitiger Filterung nach „Chastity“ und Sequenzen mit mehr als 3 uneindeutigen Basen („N“) fastq_integrity.pl Aussortieren von Sequenzen, deren Länge des Sequenzstrings mit der Länge des Qualitystrings nicht übereinstimmt fastq_splitup.pl Aufteilung der Sequenzen einer „fastq“-Datei in Datenpakete einstellbarer Größe fasta_check_iupac.pl Ausgabe der Positionen von IUPAC-Basen fasta_extract.pl Extraktion von „fasta“-Sequenzen anhand einer Liste mit „fasta“-IDs. seq_info.pl Ausgabe von: Sequenzanzahl, Basenanzahl, min. und max. Länge, Basenverteilung, n-stats und quality stats (nur für „fastq“-Dateien) fasta_n_stats.pl Ausgabe der Positionen uneindeutiger Basen alle Skripte: Benjamin Rieger und Steffen Rapp (IMSB) Die aufbereiteten Rohdaten wurden mit der Funktion „NGS Import“ in die CLC Genomics Workbench (CLC bio, Aarhus, Denmark) als „paired end“-Sequenzen eingeladen und mittels „Trim Sequences“ gefiltert. Sequenzen mit schlechter Qualität (≤ 0,005) und nicht eindeutigen Basen (N) wurden aussortiert. Zudem wurden am 5‘-Ende jeder Sequenz 5 Basen, am 3‘-Ende jeder Sequenz 20 Basen entfernt. 2.5.2.2 Assemblierung der aufbereiteten Rohdaten Mit der Funktion „de novo assembly“ der CLC Genomics Workbench wurden die aufbereiteten und getrimmten Datenpakete assembliert. Im Anschluss wurden die erhaltenen Contigs auf Vektor- und Randsequenzen überprüft und zudem untersucht, ob 39 MATERIAL UND METHODE ein Ringschluss vorliegt. Trafen diese drei Kriterien auf einen oder mehrere Contigs zu, waren dies Kandidaten für einen korrekt assemblierten Klon, welche, wie unter 2.5.3 beschrieben, weiter überprüft wurden. Waren ein oder mehrere der Kriterien nicht erfüllt, wurden die erhaltenen Contigs mittels NGEN2 (DNASTAR, Madison, USA) erneut assembliert, um weitere Kandidaten zu erhalten. Parallel wurden die Rohdaten mithilfe der Assembly Cell (CLC bio, Aarhus, Denmark) assembliert. Die verwendeten Parameter sind Tabelle 2.12 zu entnehmen. Tabelle 2.12 Parameter der Assembly Cell -w k-mer size (variiert von 25 - 31) -b bubble size (variiert von 200 - 300 in 10er Schritten) -p paired end info : fb ss 200 500 (forward-backward, start-start, 200-500 distance) -cpus Anzahl der Kerne für threads (variiert 1-16) -q -i paired end files (file1 file2) Die aus den unterschiedlichen Assemblierungen erhaltenen Kandidaten wurden mittels NGEN2 (DNASTAR, Madison, USA) erneut assembliert, um doppelte Kandidaten auszusortieren. Auf diese Weise wurde für jeden BAC-Klon ein finaler Contig erstellt. 2.5.3 Überprüfung der Kandidaten der BAC-Klone Die assemblierten Klone wurden weiteren Tests unterzogen, um sie auf Richtigkeit zu überprüfen. 2.5.3.1 Mapping der aufbereiteten Rohdaten Zunächst wurden die aufbereiteten Rohdaten mit der „Map Reads to Reference“-Funktion der CLC Genomics Workbench gegen die zusammengesetzte BAC-Sequenz kartiert. Signifikant stärker und schwächer abgedeckte Bereiche wurden mit Primer flankiert, um sie anschließend mittels Sanger-Sequenzierung zu überprüfen. 2.5.3.2 Restriktionskartierung Nach erfolgtem Mapping wurden Restriktionskartierungen durchgeführt, um die BAC- Sequenzen abschließen zu verifizieren. Mithilfe der „Restriction Site Analysis“-Funktion der CLC Main Workbench wurden Restriktionsenzyme für jeden BAC-Klon ausgewählt, sodass bei dem anstehenden Verdau bevorzugt Restriktionsfragmente mit einer Größe unter 10 kb entstanden. Sollten größere Fragmente entstehen, wurden, wenn möglich, weitere Enzyme verwendet, die in diesen Bereichen ihre Erkennungssequenz besaßen. Für jeden Klon wurden drei bis vier Restriktionsenzyme bzw. Enzymkombinationen ausgewählt. Die verwendeten Enzyme sind Tabelle 2.13 zu entnehmen. Die Restriktionen wurden mit ungefähr 600 ng Plasmid bei 37 °C ü.N. durchgeführt. Anschließend wurden die 40 MATERIAL UND METHODE Restriktionsansätze gefällt und in 10 µl HPLC-H2O aufgenommen. Die gelelektrophoretische Auftrennung erfolgte über 1 %-ige Über-Tag-Gele. Anschließend wurden die mittels CLC Main Workbench ermittelten Fragmentgrößen mit den tatsächlichen Fragmentgrößen verglichen. Abweichende Bereiche wurden mittels Sanger-Sequenzierung überprüft. Tabelle 2.13 Restriktionsenzyme und Puffer Enzym Puffer Enzym Puffer 2 2 5 5 ApaI Buffer A PstI H Buffer 4 4 2,3 2 3 AgeI NEBuffer 1 PvuI Buffer M , One-Phor-All Buffer Plus 2 2 2 2 BamHI Buffer B PvuII Buffer M 4 4 3 3 BclI NEBuffer 3 SacI One-Phor-All Buffer Plus 3 3 2 2 BglII One-Phor-All Buffer Plus SalI Buffer H 4 4 2,3 2 3 ClaI NEBuffer 4 SmaI Buffer A , One-Phor-All Buffer Plus 1 + 1 3 3 EcoRI Buffer R XbaI One-Phor-All Buffer Plus 1 + 1 2,3 2 3 EcoRV Buffer R XhoI Buffer B , One-Phor-All Buffer Plus 1,2 + 1 2 4 4 HindIII Puffer R , Buffer B XmaI NEBuffer 4 1 1 HpaI Buffer B 1 Fermentas, St. Leon-Rot, Deutschland 2 Roche Diagnostics, Mannheim, Deutschland 3 ehemals Pharmacia, heute GE Healthcare, Little Chalfont, UK 4 NEB, Ipswich, USA 5 ehemals Amersham, heute GE Healthcare, Little Chalfont, UK 2.6 Illumina Next-Generation Sequencing genomischer Apfel-DNA Zur Überprüfung der sequenzierten BAC-Klone und als Ergänzung zu diesen, wurden „mate pair“-Bibliotheken der Apfelsorte P28 erstellt. 2.6.1 Erstellung einer „mate pair“-Bibliothek Die Erstellung der „mate pair“-Bibliothek aus genomischer DNA der Apfelsorte P28 wurde mit einigen Modifikationen nach dem Illumina-Protokoll „Mate Pair Library v2 - Sample Preparation Guide“ (Illumina, San Diego, USA) durchgeführt. Fragmentierung genomischer DNA Die Isolierung hochmolekularer DNA wurde wie in Kapitel 2.2 „Konstruktion einer Apfel- BAC-Bibliothek“ durchgeführt. Allerdings wurde die DNA nach Aufreinigung durch 3 PCI- und 2 CI-Extraktionen mit 2 Volumen Ethanol abs. überschichtet und mittels Glasstab aufgewickelt. Nach einem Waschschritt mit 70 %-igem Ethanol wurde sie in HPLC-H2O abgewickelt. Die DNA-Konzentration wurde mittels Nanodrop ND-1000 (PeqLab, Erlangen, Deutschland) bestimmt. Anstelle der laut Hersteller vorgeschlagenen DNA-Menge von 10 µg wurden etwa 14 µg eingesetzt. 10 mM TE-Puffer diente als Nebulisierungspuffer. Die Fragmentierung der DNA wurde mittels Nebulizer bei 0,5 bar für 12 sec durchgeführt. Für 41 MATERIAL UND METHODE die anschließende Aufreinigung wurde das „Wizard SV Gel and PCR Clean-Up System“ der Fa. Promega (Madison, USA) nach Angaben des Herstellers verwendet. Die DNA wurde mit auf 60 °C vorgewärmtem QIAGEN EB Buffer (QIAGEN, Hilden, Deutschland) eluiert. End Repair und Biotinylierung Die Durchführung geschah nach Protokoll. Die abschließende Aufreinigung wurde wie oben beschrieben durchgeführt. Größenfraktionierung fragmentierter DNA Die Größenfraktionierung wurde mittels 0,8 %-igem TBE-„Maxi“-Gel durchgeführt. Die ausgeschnittenen Bereiche entsprachen einer Größe von 3-3,5 kb, 3,5-4 kb, 4-5 kb, 5-6 kb, 7-8 kb und 8-10 kb. Die Wiedergewinnung erfolgte mittels des „Wizard SV Gel and PCR Clean-Up System“ der Fa. Promega (Madison, USA). Die DNA wurde mit zweimal 50 µl auf 60 °C vorgewärmtem QIAGEN EB Buffer (QIAGEN, Hilden, Deutschland) eluiert. Die eluierte DNA wurde anschließend mithilfe des Qubit Fluorometers (Invitrogen™, Carlsbad, USA) und des Agilent 2100 Bioanalyzers („High Sensitivity DNA Assay“, Agilent, Santa Clara, USA) quantifiziert und auf Qualität überprüft. Zirkularisierung größenfraktionierter DNA Die Zirkularisierung wurde nach Protokoll durchgeführt. Allerdings wurde der Ansatz an die verfügbare DNA-Menge angepasst. Für die Ansätze mit einer DNA-Menge von 600 ng wurde der im Protokoll angegebene Ansatz verwendet. Für eine DNA-Menge von 400 ng wurde ein Ansatz mit 200 µl Volumen gewählt. Verdau linearer DNA Die Durchführung erfolgte nach Protokoll, lediglich das zugegebene Volumen der Reagenzien wurde dem Probenvolumen angepasst. Scheren zirkularisierter DNA Die Fragmentierung wurde mit dem Covaris S2 (Covaris, Woburn, USA) in den „MicroTubes AFA Fiber with Snap-Cap“ durchgeführt. Die ausgewählten Parameter waren: Frequency sweeping, Intensity 4, Duty Cycle 10 %, Burst per sec 200 und Time 55 sec bei 4 °C. Da das Probenvolumen der verwendeten Tubes bei maximal 130 µl lag, wurden die Proben auf ein Vielfaches davon aufgefüllt und in mehreren Schritten fraktioniert. Aufreinigung biotinylierter DNA Das Vorgehen entsprach dem des Protokolls. Als „magnetic beads“ wurden 20 µl der „Dynabeads M-280 Streptavidin“ der Fa. Invitrogen™ (Carlsbad, USA) verwendet. 42 MATERIAL UND METHODE End Repair und A-Tailing Die Durchführung entsprach den Angaben des Protokolls. Ligation der Adapter Im Gegensatz zu den Angaben des Protokolls wurden TruSeq-Adapter (Illumina, San Diego, USA) verwendet. Für die Durchführung ergab sich daraus jedoch keine Veränderung. Anreicherung der Adapter-modifizierten DNA Fragmente durch PCR Die Primer für die PCR wurden den verwendeten Adaptern angepasst. Es wurden die Enrichment-Primer P1 und P2 (Illumina, San Diego, USA) verwendet. Die PCR wurde in einem TProfessional Thermocycler (Biometra, Göttingen, Deutschland) nach Protokoll durchgeführt. Lediglich die Annealing-Temperatur wurde auf 60 °C angepasst. Nach erfolgter PCR wurden die Proben mittels des Agilent 2100 Bioanalyzers („High Sensitivity DNA Assay“, Agilent, Santa Clara, USA) überprüft. Größenselektion der Bibliothek Zur Größenfraktionierung wurden 1,5 %-ige TBE-Midi-Gele verwendet. Der Bereich von 300 bis 650 bp wurde jeweils ausgeschnitten und die DNA nach Protokoll wiedergewonnen. Abschließend diente ein „High Sensitivity DNA Assay“ des Agilent 2100 Bioanalyzers (Agilent, Santa Clara, USA) zur Quantifizierung und Qualitätsüberprüfung der „mate pair“- Bibliothek. Bis zur Sequenzierung wurde diese bei -20 °C gelagert. 2.6.2 Sequenzierung und Filterung der Rohdaten Die Sequenzierung der „mate pair“-Bibliotheken erfolgte durch das Nukleinsäure-Analyse- Zentrum (IMSB, Mainz, Deutschland) mittels 100 bp „paired-end“-Läufen auf dem Illumina®HiSeq 2000. Die erhaltenen Rohdaten wurden mithilfe des Perl-Skriptes „seq_filter“ (Benjamin Rieger, IMSB) bereinigt. Das Skript entfernt Adapter-Sequenzen. Zudem werden am 5‘-Ende einer jeden Sequenz 6 bp, am 3‘-Ende einer Sequenz 5 bp entfernt. Es werden darüber hinaus Basen entfernt, die einen Phred-Wert unter 20 aufweisen, was einer Richtigkeit der ermittelten Base von unter 99 % entspricht. Sequenzen, die nach erfolgtem Bereinigen eine Länge unter 30 bp aufweisen, wurden aussortiert. Durch die Filterung der Rohdaten treten „single end reads“ auf, also Sequenzen, deren Partner aussortiert wurde. Diese wurden für die weitere Analyse verworfen. 43 MATERIAL UND METHODE 2.7 Erstellung eines Gesamtcontigs der Co-Zielregion 2.7.1 Erstellung von Metacontigs Die Sequenzen der BAC-Klone wurden mit dem Programm SeqMan™ des Software-Pakets Lasergene® der Fa. DNASTAR Inc. (Madison, USA) assembliert, um überlappende Klone zu Metacontigs zusammenzuführen. Anhand der selbst erstellten Marker (siehe 2.9) konnten die Metacontigs bzw. BAC-Klone dem kolumnaren und dem nicht kolumnaren Chromosom zugeordnet werden. 2.7.2 Konstruktion eines Gesamtcontigs Zur Erstellung eines Gesamtcontigs wurden die Metacontigs assembliert. Auftretende Lücken zwischen Metacontigs wurden mit „long range“ PCR und anschließender Sequenzierung geschlossen. Der Gesamtcontig ist eine Consensus-Sequenz, wobei keine Unterscheidung zwischen kolumnaren und nicht kolumnaren Chromosom erfolgte. 2.8 Annotation von Genen und transposablen Elementen 2.8.1 Annotation von Genen Aus der GDR-Datenbank wurden die im GD-Genom annotierten „Coding Sequences“ (CDS) heruntergeladen. Es handelt sich dabei um Konsensus CDS, die mit den Programmen Glimmer, FGENESH, Genewise, GMAP und Twinscan vorhergesagt wurden (Velasco et al. 2010). Durch ein Mapping sollten die CDS herausgefiltert werden, die mit dem erstellten Gesamtcontig übereinstimmen. Ein Problem für ein stringentes Mapping stellen IUPAC- Basen dar, die sich sowohl im Gesamtcontig, vor allem aber in den CDS befinden. Um dies zu umgehen, wurden mithilfe des Perl-Skriptes „fasta_kmer“ der Gesamtcontig in k-mers einer Länge von 100 bp und die CDS in k-mers einer Länge von 30 bp zerlegt. Mittels „fasta- iupac-permut“ wurden die IUPAC-Basen permutiert, das bedeutet, es wurde jede IUPAC- Base durch jede mögliche Base ersetzt. Da Bereiche mit mehreren aufeinanderfolgenden „Ns“ zu 4n Möglichkeiten und damit verbunden zu einer enormen Menge an Daten führen würden, wurden diese Bereiche mittels „fasta_ncut“ herausgeschnitten und die verbleibenden Teilstücke als „eigenständige“ CDS behandelt. Die auf diese Weise erstellten k-mers der CDS wurden mittels Bowtie (Langmead et al. 2009) mit einer Stringenz von 100 % gegen die k-mers des Gesamtcontigs aligniert. Abschließend wurde quantifiziert, wie viele k-mers einer jeden CDS im Gesamtcontig treffen, wobei jedes k-mer auch bei mehreren Treffern nur einmal gezählt wurde. Für diese Berechnung wurde die 44 MATERIAL UND METHODE ursprüngliche Anzahl an k-mers verwendet und nicht die Anzahl nach der Permutierung. Es wurden die CDS extrahiert, bei denen mindestens 50 % der k-mers in dem Gesamtcontig trafen. Die Erstellung und Verwendung der Perl-Skripte sowie die Verwendung von Bowtie wurde von Benjamin Rieger (IMSB) durchgeführt. Die extrahierten CDS wurden durch das „Large Gap Mapping“ Plug-in der CLC Genomics Workbench mit Standardeinstellungen gegen den Gesamtcontig kartiert. Anhand des Mappings wurden die CDS mithilfe des Programms SeqBuilder™ der Fa. DNASTAR Inc. (Madison, USA) annotiert. Zur Annotation weiterer Gene sowie zur Überprüfung der vorhergesagten CDS wurden zwei Transkriptomdatensätze des Sprossapikalmeristems der Apfelsorte P28 aus der Doktorarbeit von Clemens Krost (2012) gegen den Gesamtcontig mithilfe des „Large Gap Mapping“ Plug-ins der CLC Genomics Workbench kartiert. 2.8.2 Annotation von transposablen Elementen Zur Identifikation transposabler Elemente wurde das Programm CENSOR (Kohany et al. 2006) genutzt, sowie für die genauere Charakterisierung von Volllängen LTR- Retrotransposons das Programm LTR-Finder (Xu und Wang 2007). CENSOR ist ein BLAST- Programm, wobei als Datenbank die „Repbase Update“ (Jurka et al. 2005) dient, eine Datenbank eukaryotischer repetitiver Elemente. Zur Identifizierung von LTRs und TSDs via Dotplot wurde das Programm MegAlign™ des Software-Pakets Lasergene® der Fa. DNASTAR Inc. (Madison, USA) verwendet. Die Annotationen wurden mit den Programmen SeqBuilder™ und CLC Genomics Workbench durchgeführt. 2.9 Herstellung Co-Gen gekoppelter Marker 2.9.1 Versuchsmaterial Als Versuchsmaterial dienten genomische DNAs der normal-wüchsigen Apfelsorte A14 und der kolumnar-wüchsigen Apfelsorte P28 sowie genomische DNAs der Nachkommenschaft aus Kreuzungen zwischen A14 und P28. P28 stammt aus Kreuzungen der kolumnaren Sorte Flamenco und der normal-wüchsigen Sorte Topaz; A14 aus der kolumnar-wüchsigen Sorte Waltz mit dem normal-wüchsigen Kreuzungspartner GD. Des Weiteren stellte die Forschungsanstalt Geisenheim genomische DNAs der kolumnaren Apfelsorten Procats 1, Procats 4, Procats 11, Procats 13, Procats 27, Greencats, Pomforyou, Pomfital, Kordonia, A10-28, A68-173, A73-19-93K, McIntosh Wijcik, Pomgold und HL 4 K, sowie der nicht kolumnaren Apfelsorten McIntosh, Elswout, Gala, Jonagold, Pinova und Topaz zur 45 MATERIAL UND METHODE Verfügung. Die Apfelsorte A73-19-93K ist im Gegensatz zu den anderen kolumnaren Apfelsorten homozygot für Co. 2.9.2 Primerdesign für PCR-basierende Marker Die Identifizierung von Insertionen und Deletionen (Indels) durch Sequenzvergleiche zwischen den BAC-Sequenzen der kolumnar-wüchsigen Apfelsorte P28 und Sequenzen der veröffentlichten normal-wüchsigen Apfelsorte GD (Velasco et al. 2010) sowie Chromosomen-spezifische Unterschiede zwischen den BAC-Sequenzen waren Grundlage für die Herstellung geeigneter Marker. Die Sequenzvergleiche wurden mit dem Software- Paket Lasergene® der Fa. DNASTAR Inc. (Madison, USA) durchgeführt. Die Primer für entsprechende Marker wurden so gewählt, dass das erwartete PCR-Produkt möglichst eine Größe unter 300 bp aufwies, damit auch Polymorphismen geringer Nukleotidanzahl gelelektrophoretisch detektiert werden konnten. Für die elektrophoretische Auftrennung wurde ein 4 %-iges Agarose-Gel verwendet. 2.9.3 Testen von Kandidaten für Co-Gen gekoppelter Marker Die entworfenen Primer wurden zunächst auf genomische DNA der Apfelsorten A14 und P28 angewandt. Waren eindeutige Unterschiede zwischen den Eltern erkennbar, wurde das Primerpaar auf 95 Einzelnachkommen (48 kolumnar, 47 nicht kolumnar) überprüft. Abschließend erfolgten Tests des Markers auf genomische DNA weiterer Apfelsorten, um eine mögliche Sortenunabhängigkeit zu untersuchen. 2.9.4 Klonierung Co-Gen gekoppelter Marker und Sequenzierung Abschließend wurden die Marker (PCR-Produkte) in pGEM®-T Easy kloniert (siehe 2.1.7) und mit den Primern T7 und Sp6 sequenziert. Die Sequenzierung wurde von der Fa. GENterprise (Mainz, Deutschland) durchgeführt. Anhand der Sequenzen konnte überprüft werden, ob der hergestellte Marker tatsächlich von dem untersuchten Locus auf Chromosom 10 stammt. 46 MATERIAL UND METHODE 2.10 Standardlösungen und Materialien Wenn nicht anders beschrieben, wurden die Lösungen mit VE-Wasser hergestellt. Agarosegel (1 %) 1 % (w/v) Agarose in TBE-Puffer (1 x) Agar-Platten 7 g Agar-Agar 5 ml Ampicillin-Lösung (10 mg/ml) oder 5 ml Chloramphenicol-Lösung (1,5 mg/ml) 25 mg IPTG und 50 mg X-Gal in 1 ml DMF in 500 ml 1x LB-Medium DNA-Ladepuffer 4 M Harnstoff 0,1 M Na2EDTA 50 % (w/v) Saccharose 0,1% (w/v) BPB Denaturierungspuffer 50 mM NaOH (Southern Blot) 1,5 M NaCl Dialysepuffer (10 x) 3 M NaCl 0,25 M Tris-HCl 1 M Na2EDTA Elektrophoresepuffer (10 x) 0,36 M Tris (E-Puffer) 0,3 M NaOH 0,1 M Na2EDTA EtBr-Färbelösung 0,001 % (v/v) EtBr-Stammlösung in 1 x E-Puffer EtBr-Stammlösung 0,5 % (w/v) EtBr in 1x E-Puffer Homogenisierungspuffer 58 g Saccharose (500 ml) 10 ml 0,1 M Na2EDTA, pH 7,4 2,5 ml 0,1 M Na2EGTA, pH 7,4 50 ml Puffer A Hybridisierungspuffer 1 x PM (in 3 x SSC) 0,5 % SDS LB-Medium 0,005 % (w/v) NaCl 0,005 % (w/v) Hefe-Extrakt 0,01 % (w/v) Trypton Lösung 1 117,5 g Saccharose (Chromatingewinnung, 250 ml) 2,5 ml 0,1 M Na2EDTA 2,5 ml 0,1 M Na2EGTA 25 ml Puffer A Lösung 2 71,88 g Saccharose (Chromatingewinnung, 100 ml) 100 µl 0,1 M Na2EDTA 100 µl 0,1 M Na2EGTA 10 ml Puffer A Lösung I (Whitehead), pH 8 10 mM Na2EDTA Lösung I, pH 8 25 mM Tris (BAC Plasmid-Minipräparation) 10 mM Na2EDTA Lösung II (Whitehead/ 0,2 M NaOH BAC Plasmid-Minipräparation) 1 % (w/v) SDS 47 MATERIAL UND METHODE Lösung III, pH 5,2 (Whitehead/ 1,875 M Kaliumacetat 96er Plasmid-Präparation) Lösung III, pH 5,2 4,5 M Kaliumacetat (BAC Plasmid-Minipräparation) L-Puffer 0,1 M Na2EDTA 0,01 M Tris, pH 7,6 0,02 M NaCl Neutralisierungslösung 0,5 M Tris/HCl, pH 7,4 (Southern Blot) 3 M NaCl PBS/BSA 10 mM MgCl2 10 mg/ml BSA in 1 x PBS Phenol/Chloroform/ 50 % 50 mM Phenol Isoamylalkohol (PCI) 48 % Chloroform (25:24:1) 2 % Isoamylalkohol Phosphate Buffered Saline (10 x) 1,37 M NaCl (PBS) 30 mM KCl 10 mM Kaliumhydrogenphosphat 0,1 M Dinatriumhydrogenphosphat Präinkubationsmedium (PM) 0,02 % (w/v) Ficoll 400 (nach DENHARDT 1966) 0,02 % (w/v) PVP 0,02 % (w/v) BSA in 3 x SSC Puffer A (10 x), pH 7,4 0,6 M KCl 0,15 M NaCl 1,5 mM Spermin 5 mM Spermidin 0,15 M Tris-HCl Saccharose-Lösung (30 %-ig) 75 g Saccharose in 1 x TBE (250 ml) 0,1 % (w/v) SDS Standard-Saline-Citrate-Puffer 3 M NaCl (20x SSC) 0,3 M Natriumcitrat Tris-Borat-EDTA-Puffer 90 mM Tris (1 x TBE) 90 mM Borsäure 25 mM Na2EDTA TE-Puffer, pH 8,0 10 mM Tris (Whitehead) 50 mM Na2EDTA TE-Puffer, pH 7,6 10 mM Tris (Chromatingewinnung) 1 mM Na2EDTA TE-Puffer, pH 8,0 10 mM Tris (shotgun-Bank) 1 mM Na2EDTA 50T/50E-Puffer, pH 8,0 50 mM Tris 50 mM Na2EDTA 48 ERGEBNISSE 3 Ergebnisse 3.1 Festlegung der Co-Zielregion Um die Ursache für das Kolumnarwachstum auf molekularer Ebene zu charakterisieren, wurde die ungefähre genomische Lage des Co-Gens zunächst berechnet. Als Grundlage dienten die von Tian et al. (2005) publizierten Marker SCAR216 und SCAR682, die sich in einem genetischen Abstand von 12,3 cM und 2,9 cM zum Co-Gen befinden. Unter Verwendung der Gleichung Pxz = Pxy + Pyz - 2PxyPyz (x: SCAR682, y: Co Gen und z: SCAR216; Abbildung 3.1) nach Lynch und Walsh (1998) ergibt sich daraus eine Rekombinationsfrequenz zwischen SCAR216 und SCAR682 (Pxz) von 0,1448, also 14,48 cM. Mit BLASTn-Suchen der Marker-Sequenzen in dem veröffentlichten GD- Genom (Velasco et al. 2010) konnte der physikalische Abstand der Marker berechnet werden. SCAR216 zeigt einen signifikanten BLASTn-Treffer auf Chromosom 10, Position 22.271.333 bp bis 22.271.508 bp, SCAR682 auf Chromosom 10, Position 17.542.255 bp bis 17.542.639 bp. Dies ergibt einen physikalischen Abstand von 4,729 Mbp. Setzt man den genetischen und den physikalischen Abstand in Beziehung zueinander, entsprechen 14,48 cM etwa 4,729 Mbp (Abbildung 3.1). Abbildung 3.1 Vereinfachte genetische bzw. physikalische Karte der Co-Gen-Region Abgebildet sind die zur Berechnung der Zielregion verwendeten Marker SCAR682 und SCAR216 mit den genetischen Abständen zum Co-Gen. Darüber hinaus ist die genetische und physikalische Distanz dieser Marker zueinander gezeigt. Daraus ergibt sich, dass 1 cM in etwa 326.000 bp entspricht. SCAR682 liegt bei ungefähr 17,5 Mbp auf Chromosom 10 mit einem Abstand von 2,9 cM zu Co. Das Co-Gen ist somit auf Chromosom 10 um Position 18,5 Mbp zu lokalisieren. Da es sich bei der Berechnung lediglich um eine grobe Abschätzung handelt, wurde die Zielregion auf Chromosom 10, Position 18 bis 19 Mbp, festgelegt. Eine Feinkartierung der Region sollte anhand selbst hergestellter molekularer Marker erfolgen (Kapitel 3.7.2). 49 ERGEBNISSE 3.2 Erstellung von Apfel-BAC-Bibliotheken Die Isolierung hochmolekularer DNA ist Grundlage für die Konstruktion genomischer BAC- DNA-Bibliotheken. Als Ausgangsmaterial dienten in-vitro-Kulturen der heterozygot kolumnaren Apfelsorte P28. Der mechanische Gewebe- und Zellaufschluss durch die Verwendung eines Stabmixers ermöglichte im Vergleich zu Homogenisator bzw. Mörser und Pistill die parallele Verarbeitung einer höheren Anzahl an in-vitro-Kulturen. Die isolierten DNAs der unterschiedlichen Ansätze wurden gelelektrophoretisch auf ihre Qualität hin untersucht. Wie exemplarisch in Abbildung 3.2 A gezeigt, hat die Hauptmasse der DNAs aller Ansätze eine elektrophoretische Mobilität deutlich kleiner als die der 23 kb- Bande des verwendeten Molekulargewichtsmarkers. Ungeachtet der verwendeten Methode zum Zell- und Gewebeaufschluss konnten große Mengen qualitativ hochwertiger DNA isoliert werden. Lediglich ein leichter Schmier ist ein Anzeichen für eine minimale Degradierung der DNA. Abbildung 3.2 Gelelektrophoretische Auftrennung genomischer P28-DNA In Teil A) ist die gelelektrophoretische Auftrennung hochmolekularer genomischer DNA gezeigt. Bei den verschiedenen Ansätzen wurden unterschiedliche Methoden für den Gewebe- und Zellaufschluss gewählt. 1/2/6: Stabmixer; 3: Mörser und Pistill; 4/5/7/8: Homogenisator In Teil B) ist eine elektrophoretische Auftrennung von DNA nach unterschiedlich starkem Verdau mit dem Restriktionsenzym Sau3AI abgebildet. Die einzelnen Spuren enthalten DNA, die variierenden Restriktionszeiten ausgesetzt war. 50 ERGEBNISSE Durch einen unvollständigen Restriktionsverdau sollten möglichst große klonierbare DNA- Fragmente generiert werden. Eine geeignete Inkubationsdauer wurde durch die Erstellung einer Restriktionskinetik ermittelt (Abbildung 3.2 B). Die Kontrolle zeigt unrestringierte genomische DNA der Sorte P28. Bereits nach zweiminütiger Inkubationsdauer ist ein deutlicher Verdau der DNA zu erkennen. Nach weiteren drei Minuten befindet sich die Hauptmasse der DNA bereits unter der 6 kb-Bande des Molekulargewichtsmarkers. Problematisch sind oft Schwankungen in der Effizienz des Restriktionsverdaus durch eine inhomogene Verteilung hochmolekularer DNA in Lösung. Dies ist anhand des 20-minütigen Verdaus in Abbildung 3.2 B zu sehen. Neben einem sehr starken Schmier ist eine Bande oberhalb der 23 kb-Bande des Molekulargewichtsmarker zu erkennen. Obwohl jeder Ansatz das gleiche Volumen an DNA-Lösung enthielt, sind deutliche Unterschiede in der Konzentration zu beobachten. Letztlich wurden Restriktionszeiten von einer, eineinhalb und zwei Minuten gewählt, da bei der Restriktionsdauer von einer und zwei Minuten ein eindeutiger Verdau stattgefunden hat, die Hauptmasse der DNA aber dennoch über der 23 kb-Bande des Molekulargewichtsmarkers liegt. Um die Auswirkungen von Unterschieden in der DNA-Konzentration zu minimieren, wurden jeweils Verdaus mit den drei oben genannten Zeiten durchgeführt und die Ansätze gepoolt. Kleine DNA-Fragmente (< 23 kb) sollten anschließend von der Hauptmasse der DNA abgetrennt werden, da sie bei einer Ligation im Vergleich zu den gewünschten großen Fragmenten bevorzugt ligieren. Aus diesem Grund wurden zwei aufeinanderfolgende Größenfraktionierungen durchgeführt. Dazu wurden zunächst „Maxi“-Gele im speziellen Natriumphosphatpuffer-System verwendet. Durch die stark begrenzte Ladekapazität dieses vertikalen Gelsystems waren zahlreiche Gele (etwa 50) notwendig, um ausreichend DNA für eine Ligation zu erhalten. Hingegen konnte durch die parallele Verwendung zweier „Mega“- Gele bereits ausreichend DNA für eine Ligation bereitgestellt werden. Nach erfolgter Größenfraktionierung wurde mittels Endfilling-Reaktion mit radioaktiv markierten Nukleotiden unterschiedlicher Zusammensetzung überprüft, ob die überhängenden DNA-Enden intakt waren und eine Ligation in mit BamHI restringierten pBeloBAC11 möglich war (Tabelle 3.1). 51 ERGEBNISSE Tabelle 3.1 Strahlungsintensitäten zur Überprüfung der Integrat-Enden Ansatz Pellet 1 Überstand 1 Pellet 2 Überstand 2 A* 10 Bq 750 Bq 1,7 Bq 4,5 Bq GA* 38 Bq 760 Bq 5 Bq 18 Bq GATC* 70 Bq 770 Bq 42 Bq 10 Bq GA*TC* 115 Bq 1210 Bq 70 Bq 25 Bq Integrat-Ende 1: Fällung; 2: Waschschritt; *: radioaktiv markiert Bei intakten Integrat-Enden erfolgt der Einbau der Nukleotide in der Reihenfolge dGTP, dATP, dTTP und dCTP. Ansatz A* zeigt die Hintergrundstrahlung an, also die Strahlungsintensität, die messbar ist, obwohl kein Einbau des radioaktiv markierten Nukleotids stattgefunden hat, da das radioaktive Nukleotid α-32P-dATP ohne die Anwesenheit von dGTP nicht eingebaut werden kann. Im Vergleich dazu enthält der Ansatz GA* neben dem radioaktiv markierten dATP auch dGTP. Nach der Fällung zeigt das Pellet eine deutliche Strahlung und damit den Einbau der Nukleotide. Der Ansatz GATC* weist nach der Fällung ebenfalls eine deutliche Strahlung auf. Da in diesem Ansatz radioaktiv markiertes dCTP verwendet wurde, lässt die gemessene Strahlung die Schlussfolgerung zu, dass Moleküle vorlagen, deren kompletter Überhang intakt war. Der Ansatz GA*TC* bestätigt dies. Die unterschiedlich hohe Strahlung zwischen den Ansätzen GA* und GATC* ist darauf zurückzuführen, dass das radioaktiv markierte dCTP eine höhere spezifische Strahlung aufweist als das markierte dATP. Die Messungen nach dem Waschschritt bestätigen die Messungen der Fällungen, lediglich Ansatz GA* zeigt eine deutlich schwächere Strahlung im Pellet. Möglicherweise führte hier der Waschschritt zum Verlust des Pellets. Die Endfilling-Reaktionen zeigten, dass ausreichend DNA-Enden generiert wurden und diese trotz der zahlreichen Arbeitsschritte erhalten blieben. Die überprüften Fraktionen wurden kloniert. Für die Transformationen von BAC-Banken wurden elektrokompetente Zellen mit einer Transformationsrate von 5×109 bis 1×1010 verwendet. Es wurden vier BAC-Bibliotheken hergestellt (P28ivL4, P28ivL10, P28ivML1 und P28ivML2), die sich durch die Ausgangsmenge des eingesetzten Materials, die Art des Gewebeaufschlusses und das für die Größenfraktionierung verwendete Gelelektrophorese- system unterschieden. Der Gewebeaufschluss der Banken P28ivL4 und P28ivL10 wurde mittels Homogenisator durchgeführt, ehe dieser durch Verwendung eines Stabmixers erfolgte. Die Größenfraktionierungen erfolgten bei den Banken P28ivML1 und P28ivML2 anstelle von „Maxi“-Gelen mit „Mega“-Gelen. Die Banken P28ivL10 und P28ivML2 wurden nur mit der Hälfte (15 g) an Ausgangsmaterial hergestellt. 52 ERGEBNISSE Um die statistische Genomabdeckung der erstellten BAC-Bibliotheken näherungsweise zu ermitteln, wurden die Plasmide zufällig ausgewählter Klone isoliert. Nach erfolgtem Restriktionsverdau wurden die Plasmide gelelektrophoretisch aufgetrennt und die Integratgröße bestimmt (Abbildung 3.3). Abbildung 3.3 Restriktionsverdaus der Plasmide ausgewählter BAC-Klone Die Abbildung zeigt die gelelektrophoretische Auftrennung von EcoRI geschnittener Plasmid-BAC- DNA. Bei allen Klonen lässt sich eine Vektorbande in Höhe von etwa 6600 bp erkennen (schwarzer Pfeil). Da die Ansätze nicht entsalzt wurden, ist im unteren Bereich des Gelbildes eine starke Salzfront sichtbar. Exemplarisch sind in dieser Abbildung die Klone der Transformationen P28ivML1 gezeigt. Der verwendete Vektor pBeloBAC11 besitzt zwei Restriktionsschnittstellen für EcoRI. Es entstehen ein großes Fragment von 6633 bp und zwei weitere Fragmente (852 bp und 22 bp), die jedoch mit Teilen des Integrates verbunden sind und somit nicht als einzelne Banden bei einer gelelektrophoretischen Auftrennung zu erkennen sind. Anhand des gezeigten Gelbildes konnten die ungefähren Integratgrößen der BAC-Klone abgeschätzt werden (Tabelle 3.2). 53 ERGEBNISSE Tabelle 3.2 Integratgrößen ausgewählter BAC-Klone Klon Größe Klon Größe Klon Größe 1 36 kb 5 24 kb 9 20 kb 2 18 kb 6 55 kb 10 22 kb 3 30 kb 7 30 kb 11 18 kb 4 38 kb 8 22 kb 12 16 kb Ø der Integratgröße: 27 kb Anhand der ermittelten durchschnittlichen Integratgröße der BAC-Klone von 27 kb und der Gesamtanzahl an Kolonien der BAC-Bibliothek konnte die statistische Genomabdeckung bestimmt werden. In Tabelle 3.3 sind die erfolgreich konstruierten BAC-Bibliotheken mit Anzahl der Kolonien, durchschnittlicher Integratgröße und daraus resultierender Gesamtintegratgröße aufgelistet. Unter Verwendung der Carbon-Clarke-Formel wurde die Wahrscheinlichkeit (P), dass ein einmaliger („single-copy“) DNA-Abschnitt in der BAC-DNA- Bibliothek enthalten ist, berechnet (Clarke und Carbon 1976). Die Formel lautet: P = 1 - (1-f)N (N: Anzahl der Kolonien; f: Klongröße dividiert durch die Genomgröße) Tabelle 3.3 BAC-DNA-Bibliotheken der Apfelsorte Procats 28 Bank Anzahl an Kolonien Ø Integratgröße Gesamtintegratgröße P (Carbon-Clarke) P28ivL4 26.000 27 kb 702 Mbp 0,61 P28ivL10 13.000 31 kb 403 Mbp 0,42 P28ivML1 79.000 27 kb 2.133 Mbp 0,94 P28ivML2 35.000 24 kb 840 Mbp 0,68 Gesamt 153.000 26,5 kb 4.078 Mbp 0,99 Die erstellten BAC-DNA-Bibliotheken umfassten insgesamt rund 150.000 Klone, die zusammengenommen rund 4.000 Mbp genomische Apfel-DNA enthielten. Geht man von einer Genomgröße des Apfels von 742,3 Mbp aus (Velasco et al. 2010), entspricht dies einer statistischen Genomabdeckung von etwa 5,4-fach. Die Wahrscheinlichkeit, dass ein „single- copy“ DNA-Abschnitt in den erstellten BAC-DNA-Bibliotheken vorhanden ist, beträgt nach der Carbon-Clarke-Formel 99 %. 54 ERGEBNISSE 3.3 Screening der Apfel-BAC-Bibliotheken Um die Apfel-BAC-Bibliotheken nach Klonen aus der Co-Region durchsuchen zu können, mussten zunächst geeignete Sonden für das Screening hergestellt werden. Die genomische Region des Co-Gens konnte grob auf Chromosom 10 Position 18 bis 19 Mbp eingegrenzt werden (siehe 3.1). Die verwendeten Sonden wurden in insgesamt vier Runden erstellt. Der erste und zweite Teil der Sonden beruht auf Roche 454- bzw. Illumina-Transkriptomdaten von Clemens Krost (2012), die gegen die Contigs der Zielregion des GD-Genoms kartiert wurden (Anhang Tabelle A2.1 und Tabelle A2.2). In einer dritten Runde wurden Sonden in die Bereiche gelegt, in denen noch keine BAC-Klone lokalisiert werden konnten. Als Sequenzgrundlage dienten die annotierten Contigs des GD-Genoms (Anhang Tabelle A2.3). Es wurden bevorzugt Sonden erstellt, die in Exon-Bereichen der Gene in der Zielregion liegen, um auf diese Weise die Chance auf einen „single-copy“-Charakter zu erhöhen. In einer vierten Runde wurde speziell die Region um 18,7 Mbp auf Chromosom 10 untersucht, da dieser Bereich bisher von keinem Klon abgedeckt wurde. Die Schwierigkeit lag vor allem darin, dass im GD-Genom keine Contigs an dieser Stelle annotiert sind. Sonden wurden in die Randbereiche von „long range“ PCR-Produkten gelegt, die in die Lücke hineinreichten (Anhang Tabelle A2.4). Alle erstellten Sonden wurden zunächst mit Southern oder „Pirotta“ Blot-Analysen auf repetitive Elemente überprüft. In Abbildung 3.4 ist exemplarisch die gelelektrophoretische Auftrennung einiger Sonden (A) und das dazugehörige Autoradiogramm (B) des „Pirotta“ Blots zu sehen. Abbildung 3.4 „Pirotta“ Blot potenzieller Sonden In A) ist die gelelektrophoretische Auftrennung 13 potenzieller Sonden abgebildet. Als Marker (M) wurde die 100 bp Ladder verwendet. B) zeigt den „Pirotta“ Blot dieses Gels. Als Sonde diente radioaktiv markierte genomische P28-DNA. Sonden in den Spuren 2 und 5 enthalten vermutlich hoch- und mittelrepetitive Elemente und wurden daher für ein Screening ausgeschlossen. 55 ERGEBNISSE Die Sonden in den Spuren 2 und 5 zeigen im Autoradiogramm des „Pirotta“ Blots ein starkes bzw. sehr starkes Signal, sodass sie vermutlich mittel- oder hochrepetitive Elemente beinhalten und für ein Screening somit nicht infrage kommen. Die Sonde der Spur 7 zeigt ein Signal im „Pirotta“ Blot, jedoch nicht auf Höhe des spezifischen PCR-Produktes. Aus diesem Grund konnte diese Sonde nach Aufreinigung durch eine präparative Gelelektrophorese verwendet werden. Der Großteil der Sonden, wie bspw. die in Spur 10, zeigt eine distinkte Bande nach der gelelektrophoretischen Auftrennung und kein Signal im „Pirotta“ Blot. Hoch- und mittelrepetitive Elemente konnten somit ausgeschlossen werden, und die Sonden sind demnach für ein Screening geeignet. Die Sonden für die Region um 18,7 Mbp auf Chromosom 10 zeigten alle ein schwaches Signal im „Pirotta“ Blot. Da es jedoch nicht möglich war, „single-copy“ Sonden in diesem Bereich zu erstellen, wurden sie dennoch für ein Screening verwendet. Mittels Koloniefilter-Hybridisierung wurden die Apfel-BAC-Bibliotheken nach Klonen aus der Zielregion durchsucht. Sondenpools von bis zu 14 Sonden wurden für das Screening eingesetzt (Anhang A2). Mit den Sondenpools 1, 2 und 3 konnten insgesamt 61, mit dem Sondenpool 4 51 positive Klone identifiziert werden (Tabelle 3.4). Die genomweite Duplikation (u.a. Chromosom 5 und Chromosom 10) sowie die Tatsache, dass Sondenpool 4 repetitive Sonden enthielt, gaben Anlass zu der Vermutung, dass nicht alle positiven Klone von Chromosom 10 stammen. Um die genomische Lage der BAC-Klone zu ermitteln, wurden Randsequenzierungen der Klone durchgeführt. In Tabelle 3.4 sind die Ergebnisse der Randsequenzierungen dargestellt. Zudem sind die positiven Klone der entsprechenden BAC-Bibliothek sowie dem verwendeten Sondenpool zugeordnet. Tabelle 3.4 Lokalisierung positiver BAC-Klone der Koloniefilter-Hybridisierung Gesamt- Sondenpool Sondenpool Sondenpool Sondenpool Bank integratgröße 1 2 3 4 P28ivL4 702 Mbp 3/3/0/0 - - - P28ivL10 403 Mbp 2/1/1/0 - - - P28ivML1 2.133 Mbp 25/14/9/2 16/8/2/6 15/10/1/4 - P28ivML2 840 Mbp - - - 51/1/2/48 Zu den Sondenpools: Gesamtzahl pos. Klone/Klone Chr.10/Klone Chr.5/Klone anderes Chr. Von den 61 positiven Klonen, die mithilfe der Sondenpools 1, 2 und 3 detektiert wurden, stammen 36 von Chromosom 10, 13 von Chromosom 5 und 12 von anderen Chromosomen. Von den 51 positiven Klonen bei Verwendung von Sondenpool 4 konnte lediglich ein Klon auf Chromosom 10 lokalisiert werden. Zwei weitere stammen von Chromosom 5 und 48 Klone von diversen anderen Chromosomen. Durch die Randsequenzierungen konnten 56 ERGEBNISSE somit insgesamt 37 Klone identifiziert werden, die auf Chromosom 10 in der Region 18 bis 19 Mbp lokalisiert werden konnten. Diese Klone sind in Tabelle 3.5 in der Reihenfolge ihrer genomischen Lage aufgelistet. Aus der genomischen Lage der Randsequenzen und den Restriktionsverdaus der isolierten Plasmide konnten zunächst die erwarteten Integratgrößen abgeschätzt werden. Die tatsächliche Integratgröße wurde durch die vollständige Sequenzierung (Kapitel 3.4) ermittelt. Die Zuordnung zu einem Metacontig ist in Kapitel 3.5 beschrieben. Tabelle 3.5 BAC-Klone aus der Co-Zielregion BLAST-Treffer BLAST-Treffer Berechnete Tatsächliche Klon Metacontig (Sp6) (T7) Integratgröße Integratgröße D2 18,088 Mbp 18,139 Mbp 51 kb 50.708 bp 1nc 2D8 18,130 Mbp 18,166 Mbp 36 kb 37.644 bp 1c K4 18,139 Mbp 18,173 Mbp 34 kb 32.824 bp 1c 3I9 18,167 Mbp Chr. 6 1c F7 18,198 Mbp 18,225 Mbp 27 kb 27.410 bp 2nc A4 18,20 Mbp 18,245 Mbp 45 kb 41.914 bp 2nc C5 18,20 Mbp 18,246 Mbp 46 kb 38.600 bp 2nc B3_3 18,227 Mbp 18,263 Mbp 36 kb 34.206 bp 2nc J7_3 18,237 Mbp 18,269 Mbp 32 kb 35.082 bp 2nc 2G4 18,261 Mbp 18,302 Mbp 41 kb 42.491 bp 2nc 3G6 18,263 Mbp 18,293 Mbp 30 kb 29.226 bp 2nc K25 18,292 Mbp 18,312 Mbp 20 kb 24.397 bp 3c I3 18,293 Mbp 18,352 Mbp 59 kb 44.784 bp 3c A8 18,297 Mbp 18, 340 Mbp 43 kb 29.002 bp 3c 2J6 unbekannt 18,408 Mbp 3nc J2 18,387 Mbp 18,425 Mbp 38 kb 35.096 bp 4c H3 18,420 Mbp 18,460 Mbp 40 kb 51.371 bp 4c I2_2 18,465 Mbp 18,507 Mbp 42 kb 44.881 bp 4c L2 18,500 Mbp 18,535 Mbp 35 kb 34.525 bp 4nc B9 18,512 Mbp 18,542 Mbp 30 kb 29.256 bp 4nc H1 18,472 Mbp 18,534 Mbp 62 kb 62.343 bp 4c H2 18,541 Mbp 18,571 Mbp 30 kb 30.259 bp 4nc H4 18,559 Mbp 18,579 Mbp 20 kb 19.886 bp 4nc G5 18,550 Mbp Chr. 13 5c D4 Chr. 14 18,600 Mbp 5c 2F3 18,608 Mbp 18,645 Mbp 37 kb 37.004 bp 6nc 2I8 18,622 Mbp 18,653 Mbp 31 kb 31.427 bp 6c_a 3B8 18,641 Mbp 18,665 Mbp 24 kb 25.455 bp 6nc 2I4 18,661 Mbp Chr. 4 6c_b K65 Chr.4 Chr.4 34 kb 34.006 bp 6c_b I2_3 18,749 Mbp 18,800 Mbp 51 kb 59.881 bp 7c G4_3 18,775 Mbp 18,804 Mbp 29 kb 29.444 bp 7nc F1_3 18,798 Mbp 18,850 Mbp 52 kb 54.162 bp 7nc A4_3 18,806 Mbp 18,869 Mbp 63 kb 60.065 bp 7c K2_3 Chr. 0 18,836 Mbp 7c A9_3 18,837 Mbp 18,859 Mbp 22 kb 21.609 bp 7c 1C3 18,884 Mbp 18,923 Mbp 39 kb 39.293 bp 8c rot: vermutlich chimärer BAC-Klon (Kapitel 3.4.3) 57 ERGEBNISSE Da es sich bei dem verwendeten Referenzgenom um das GD-Genom (Velasco et al. 2010) handelt, die BAC-Klone aber der Apfelsorte P28 entstammen, waren Unterschiede zwischen der aufgrund der publizierten Apfelgenomsequenz abgeschätzten und tatsächlichen Integratgröße durchaus zu erwarten. So liegen bspw. bei dem Klon H3 die Randsequenzen nach BLASTn-Suchen etwa 40 kb auseinander, die tatsächliche Integratgröße beträgt jedoch etwa 51 kb. Diese Differenz und damit ein möglicher Unterschied zwischen dem kolumnaren und nicht kolumnaren Chromosom ist Gegenstand der detaillierten Sequenzauswertung in Kapitel 3.5. Sechs BAC-Klone sind in Tabelle 3.5 in rot dargestellt. Bei diesen liegt einer der BLAST-Treffer der Randsequenzen eindeutig auf Chromosom 10, der andere weist einen signifikanten Treffer auf einem anderen Chromosom auf. In diesen Fällen handelt es sich höchstwahrscheinlich um in-vitro-Ligate, also um ein Vektormolekül, das zwei Integratmoleküle aufgenommen hat (chimäres Plasmid). Diese Klone wurden dennoch vollständig sequenziert und anschließend genauer analysiert (Kapitel 3.4.3). Der Klon K65 zeigt bei BLASTn-Suchen der Randsequenzen eindeutige Treffer auf Chromosom 4. Wie sich allerdings später herausstellte, wurde der entsprechende Contig von Velasco et al. (2010) falsch annotiert und K65 liegt auf Chromosom 10 (Kapitel 3.4.3). 3.4 BAC-Klone aus der Co-Zielregion und Illumina Next-Generation Sequencing 3.4.1 Sequenzierung und Assemblierung der BAC-Klone Die Klone K25, H2, H4 und K4 wurden mittels Shotgun-Sequenzierung vollständig sequenziert. Die Sequenzen der Subklone wurden mit dem Software-Paket Lasergene™ der Fa. DNASTAR Inc. in einen Kloncontig assembliert. Der BAC-Klon K25 besitzt ein Integrat mit einer Länge von 24.397 bp. Die Längen der Integrate von H2, H4 und K4 betragen 30.259, 19.886 und 32.824 bp. Der Klon K65 wurde mittels „Primer-Walk“ und Sanger-Sequenzierung vollständig sequenziert und besitzt eine Integratgröße von 34.006 bp. Aus Zeit- und Kostengründen wurden die verbleibenden 32 BAC-Klone mittels Illumina Next-Generation Sequencing sequenziert. Hierzu wurden „paired-end“-Bibliotheken der Plasmide erstellt und diese mit dem Illumina HiSeq 2000 sequenziert. Pro Klon wurden 3,5 bis 12 Mio. Sequenzen (Reads) generiert. Diese Rohdaten wurden nach erfolgter Integritätsprüfung („fastq_integrity.pl“) für die de novo-Assemblierung der BAC-Klone verwendet. Insgesamt konnte für alle 32 58 ERGEBNISSE Klone ein Contig erstellt werden, der die geforderten Kriterien (Einschluss der Sp6/T7- Randsequenzen und Ringschluss) erfüllte. Zur bioinformatischen Überprüfung wurden die gefilterten Reads gegen die Contigs mittels CLC Genomics Workbench kartiert. Bereiche auffälliger Sequenzabdeckung wurden durch Sanger-Sequenzierungen verifiziert. Zur abschließenden Untersuchung wurden Restriktionskartierungen durchgeführt. In Abbildung 3.5 und Tabelle 3.6 sind exemplarisch die gelelektrophoretische Auftrennung der Restriktionsverdaus des Klons 3G6 und die in silico berechneten Fragmentgrößen für zwei der vier Restriktionsverdaus dargestellt. Tabelle 3.6 Berechnete Fragmentgrößen des Klons 3G6 HindIII EcoRV x XbaI 8279 6805 6268 5596 5105 4706 4000 3862 2679 2954 2302 2834 1804 2455 1649 2204 1505 1903 1326 936 1320 864 233 776 173 498 133 229 17 143 Abbildung 3.5 Restriktionskartierung des BAC-Klons 3G6 Die Abbildung zeigt das Fragmentmuster von vier Restriktionsverdaus des BAC-Klons 3G6 mit den Enzymen HindIII, PstI, EcoRV und XbaI sowie HpaI und XbaI nach gelelektrophoretischer Auftrennung. Zur Größen- bestimmung dienen die in den beiden äußeren Spuren aufgetragenen Molekulargewichtsstandards. Kritische Stellen in den Restriktionsverdaus sind durch farbige Rahmen markiert. Die anhand des Gels abgeschätzte Größe der Banden wurde mit den in silico berechneten Größen verglichen. Bei einer Übereinstimmung kann man von einer korrekt zusammengesetzten BAC-Sequenz ausgehen. Allerdings handelt es sich bei der 59 ERGEBNISSE Größenbestimmung der Fragmente aufgrund des Gelbildes lediglich um eine Abschätzung, sodass kleine Abweichungen nicht berücksichtigt werden können. Zudem sind Fragmente unter 300 bp von der Lauffront überlagert und wurden daher ignoriert. In dem ausgewählten Beispiel des BAC-Klons 3G6 treten zwei Phänomene auf, die vereinzelt beobachtet werden konnten. Zum einen wurde im Doppelverdau mit EcoRV und XbaI eine XbaI-Schnittstelle vermutlich nicht geschnitten. Die erwarteten Banden bei 498 bp und 4706 bp treten nicht auf, dafür ist eine Bande auf Höhe von ungefähr 5200 bp sichtbar (Abbildung 3.5, Tabelle 3.6, grün). Die gleiche XbaI-Schnittstelle ist auch im Doppelverdau mit HpaI und XbaI nicht geschnitten. Eine Sequenzanalyse zeigt jedoch eine intakte XbaI- Schnittstelle. Das zweite Phänomen zeigt sich im Restriktionsverdau mit HindIII. Die berechneten Fragmente ergeben u.a. ein DNA-Molekül von 1320 bp und eines von 1326 bp Größe. Der minimale Größenunterschied sollte in einer Bande doppelter Intensität resultieren. Das Agarosegel zeigt jedoch zwei klare Einzelbanden (Abbildung 3.5, Tabelle 3.6, rot). Die Bereiche wurden aus diesem Grund einer PCR-Analyse unterzogen. Das PCR- Produkt, welches der 1320 bp-Bande entspricht, zeigte erneut eine langsamere Laufgeschwindigkeit in der Gelelektrophorese. Die anschließende Sequenzierung der Banden bestätigte jedoch die vermuteten Sequenzen. Die langsamere Laufgeschwindigkeit der 1320 bp-Bande muss somit in der Sequenz begründet sein. Eine mögliche Erklärung dieser zwei Phänomene wird in Kapitel 4.3 ausführlich diskutiert. Insgesamt wurden auf diese Art und Weise alle Illumina-sequenzierten BAC-Klone überprüft und die Sequenzen bestätigt. Die mittels Sequenzierung bestimmte Integratgröße der BACs ist in Tabelle 3.5 aufgelistet. 3.4.2 Genomische Illumina-Sequenzdaten der Apfelsorte P28 Als Ergänzung zu den BAC-Klonen und zur Identifizierung chimärer BAC-Klone sowie zur Verifizierung der im Laufe dieser Arbeit erstellten Metacontigs und des Gesamtcontigs (Kapitel 3.5.1) wurden genomische Illumina „mate pair“-Bibliotheken der Apfelsorte P28 erstellt und sequenziert. In Tabelle 3.7 sind Umfang, Zusammensetzung und Qualität der Illumina-Rohdaten und der gefilterten (gf) Illumina-Datensätze der „mate pair“- Bibliotheken (mp) gezeigt. Die statistische Auswertung erfolgte mit Hilfe des Perl-Skriptes „seq_info.pl“. Der „forward“- und „reverse“-Datensatz einer Sequenzierung wurden jeweils zusammengefasst und die durch das Filtern der Rohdaten entstandenen „single end“-Reads verworfen. Wurde eine Bibliothek mehrfach sequenziert, so ist dies durch römische Ziffern 60 ERGEBNISSE gekennzeichnet. Die bei der Herstellung der Banken verwendete Fragmentgröße ist jeweils angegeben. Tabelle 3.7 Statistische Auswertung der genomischen Illumina „mate pair“-Reads Ø-liche Anzahl der Anzahl der Ø-liche Bibliothek % AT % GC % N Qualität Sequenzen Basen Sequenzlänge [Phred] mp_3,5-4 kb 42.195.980 4.261.793.980 101,00 59,55 40,30 0,15 34,66 mp_3,5-4 kb_gf 38.316.692 3.321.641.056 86,72 60,49 39,51 0 37,47 mp_5-6 kb 62.874.970 6.350.371.970 101,00 59,90 39,95 0,15 34,35 mp_5-6 kb_gf 56.039.022 4.871.150.479 86,95 60,85 39,15 0 37,43 mp_7-8 kb_I 67.204.562 6.787.660.762 101,00 60,30 39,52 0,18 34,78 mp_7-8 kb_I_gf 60.624.108 5.336.986.428 88,04 61,02 38,98 0 37,59 mp_7-8 kb_II 169.925.944 17.162.520.344 101,00 60,74 39,24 0,02 34,94 mp_7-8 kb_II_gf 154.347.190 13.578.500.132 87,98 61,20 38,80 0 37,23 mp_7-8 kb_III 173.633.588 17.536.992.388 101,00 60,71 39,27 0,02 35,19 mp_7-8 kb_III_gf 157.782.392 13.911.790.073 88,17 61,17 38,83 0 37,40 Gesamt: gf 467.109.404 41.020.068.168 87,83 61,07 38,93 0 37,38 Nach erfolgter Bereinigung der Rohdaten standen etwa 467 Mio. „mate pair“-Reads zur Verfügung, was einer statistischen Genomabdeckung von rund 55-fach entspricht. In Abbildung 3.6 ist die Anzahl der Reads gegen die Abstände der zusammengehörigen „forward“- und „reverse“-Sequenzierung eines exemplarischen Mappings der „mate pair“- Bibliotheken mit maximaler Stringenz dargestellt. Die tatsächlichen Abstände der „mate pair“-Reads in dem Mapping spiegeln die Größe der eingesetzten Fragmente für die erstellten Bibliotheken wider, was für erfolgreich erstellte „mate pair“-Banken spricht. Abbildung 3.6 Tatsächliche Abstände der „mate pair“-Reads Gezeigt ist die grafische Auftragung der Anzahl der Sequenzen gegenüber der Distanz der „forward“- und „reverse“-Sequenzierung eines Moleküls. 61 ERGEBNISSE Bei der Kartierung der Sequenzen fiel jedoch auf, dass außergewöhnlich viele „mate pair“- Reads identisch waren. Aus diesem Grund wurden mit der Funktion „Remove Duplicate Reads“ die kartierten „mate pair“-Reads des exemplarischen Mappings überprüft. Die Ergebnisse sind in Tabelle 3.8 aufgeführt. Auffällig ist die extrem hohe Anzahl an Duplikaten in der Bibliothek mp_7-8 kb. Diese liegt je nach Sequenzierung bei knapp 50 bis über 70 %. Tabelle 3.8 Statistische Analyse von Duplikaten in den „mate pair“-Bibliotheken Datensätze Kartierte Reads Duplikate % Duplikate Verbleibende Reads mp_3,5-4 kb_gf 7.752 306 3,95 7446 mp_5-6 kb_gf 11.536 1.508 13,07 10.028 mp_7-8 kb_I_gf 11.880 5.860 49,33 6020 mp_7-8 kb_II_gf 24.312 17.354 71,38 6958 mp_7-8 kb_III_gf 28.840 20.924 72,55 7916 Gesamt 84.320 45.952 54,5 38.368 Leider konnte die Funktion „Remove Duplicate Reads“ nicht auf die aufbereiteten Rohdaten angewandt werden, da dazu nicht ausreichend Rechenkapazität zur Verfügung stand. Allerdings ist davon auszugehen, dass die in Tabelle 3.7 errechnete Anzahl von 41 Milliarden Basen nicht einer statistischen Genomabdeckung von etwa 55-fach entspricht, sondern diese bei über 50 % Duplikaten nur etwa 26-fach beträgt. 3.4.3 Analyse chimärer BAC-Klone Die in Tabelle 3.5 in rot dargestellten BAC-Klone (3I9, 2J6, G5, D4, 2I4 und K2_3) weisen bei BLASTn-Suchen der Randsequenzen Treffer auf unterschiedlichen Chromosomen auf, was ein Hinweis auf ein chimäre Plasmide sein kann. Bei einem in-vitro-Ligat sollte eine mögliche Verbindungsstelle zwischen den DNA-Fragmenten unterschiedlicher chromosomaler Herkunft in einem Mapping der „mate pair“-Datensätze von keinen „mate pair“-Read überspannt werden. Zudem sollte eine vermeintliche Verbindungsstelle mittels BLASTn-Suchen zu identifizieren sein. In Abbildung 3.7 sind Ausschnitte der Mappings am Beispiel von K2_3 und 2I4 dargestellt. Im Falle von K2_3 ist ein deutlicher Bruchpunkt (Abbildung 3.7 A, roter Pfeil) zu erkennen. Kein „paired read“ überspannt diese Stelle, weshalb man davon ausgehen kann, dass diese Verbindungsstelle im Genom so nicht existiert. Der Bruchpunkt beinhaltet die Sequenz „GATC“, was ein weiterer Hinweis dafür ist, dass hier ein in-vitro-Ligat vorliegt, bei dem zwei Sau3AI-Fragmente miteinander über die Sau3AI-überhängenden Enden verbunden wurden. 62 ERGEBNISSE Abbildung 3.7 Mapping der „mate pair“-Reads gegen die BAC-Klone K2_3 und 2I4 A) zeigt das Mapping der genomischen „mate pair“-Reads gegen den BAC Klon K2_3. Die Verbindungsstelle zwischen den zwei DNA-Molekülen unterschiedlicher chromosomaler Herkunft ist mit einem roten Pfeil markiert und die dort liegende Basenabfolge „GATC“ vergrößert dargestellt. In B) ist das Mapping des Klons 2I4 abgebildet. Hier ist keine Verbindungsstelle zu identifizieren. Der Bereich um 24.000 bis 33.000 bp fällt durch eine wesentlich höhere Abdeckung als der restliche Teil des Klones auf, was auf repetitive Strukturen in diesem Bereich hindeutet (rot umrandet). In beiden Mappings ist nur ein Ausschnitt der kartierten Reads gezeigt. Zudem wurden ausschließlich „paired reads“ kartiert. Auf diese Weise wurde der von Chromosom 10 stammende Anteil bei den Klonen 3I9, 2J6, G5, D4 und K2_3 identifiziert und verifiziert (Tabelle 3.9). Tabelle 3.9 Zusammensetzung chimärer BAC-Klone Klon Integratgröße Integrat von Chr. 10 3I9 56.310 bp 29.257 bp 2J6 nicht bestimmt 29.422 bp G5 70.861 bp 35.737 bp D4 76.546 bp 46.805 bp K2_3 112.223 bp 57.867 bp 63 ERGEBNISSE Im Gegensatz dazu wird der BAC-Klon 2I4 in dem durchgeführten Mapping der „mate pairs“ komplett überspannt. Auffällig ist jedoch die hohe Abdeckung im Bereich um 24.000 bis 33.000 bp, die auf repetitive Strukturen hindeutet (Abbildung 3.7 B). In Abbildung 3.8 ist ein Schema des Klons inklusive der BLASTn-Treffer dargestellt. Abbildung 3.8 Schema des BAC-Klons 2I4 inklusive BLASTn-Treffern Dargestellt sind der BAC-Klon 2I4 mit Transposon, sowie den BLASTn-Treffern von Chromosom 10 (MDC038765.9) und Chromosom 4 (MDC023034.28). Der Grafik sind zudem die Positionen der Sonden 2I4_S1 und 34.28_S1 zu entnehmen. Die Primer für eine überspannende „long range“ PCR sind mit „a“ und „b“ gekennzeichnet; die Primer der inversen PCR mit „c“ und „d“. Zur Klärung der Frage, ob es sich bei dem Klon 2I4 um ein in-vitro-Ligat handelt, wurde eine „long range“ PCR auf genomische P28 DNA durchgeführt, die das Transposon (Abbildung 3.7, roter Kasten) und damit die mögliche Verbindungsstelle überspannt. Die verwendeten Primer sind in Abbildung 3.8 mit „a“ und „b“ gekennzeichnet. Das erwartete Produkt von rund 11 kb konnte amplifiziert und mittels zweier Sequenzierungen verifiziert werden. Des Weiteren wurden genomische Southern Blot Analysen mit den Sonden 2I4_S1 und 34.28_S1 durchgeführt. Die verwendeten Restriktionsenzyme und die damit verbundenen erwarteten Fragmentgrößen auf dem Autoradiogramm sind in Tabelle 3.10 aufgelistet Tabelle 3.10 Erwartete Fragmentgrößen der Southern Blot Analysen des BAC-Klons 2I4 Enzym EcoRI HpaI SacI SacII PstI 2I4_S1 17.529 bp 7.361 bp 6.433 bp 48.199 bp 22.265 bp 34.28_S1 17.529 bp 8.314 bp 10.628 bp 48.199 bp 22.265 bp Das Gelbild (A) und die Autoradiogramme der Sonden 2I4 (B) und 34.28_S1 (C) sind in Abbildung 3.9 dargestellt. Das Agarosegel wurde unidirektional geblottet und die Nitrozellulosemembran zunächst mit der Sonde 2I4_S1 und anschließend mit der Sonde 34.28_S1 hybridisiert. Der EcoRI-Verdau zeigt auf beiden Autoradiogrammen ein definiertes Signal erwarteter, identischer Größe. Die Signale des HpaI-Verdaus sind auf den Autoradiogrammen ebenfalls gleich, sodass vermutlich die HpaI-Schnittstelle im Transposon nicht geschnitten wurde. Der SacI-Ansatz zeigt auf beiden Autoradiogrammen ein Signal in der erwarteten Höhe. Die Signale des Ansatzes SacII liegen in einem 64 ERGEBNISSE Größenbereich, der mit dem verwendeten Gelelektrophorese-System nicht zufriedenstellend aufgetrennt werden konnte. Der Verdau von PstI scheint zudem unvollständig zu sein. Dennoch bestätigen die Signale im Autoradiogramm des EcoRI-, HpaI- und PstI-Verdaus die angenommene genomische Struktur. Abbildung 3.9 Southern Blots des BAC-Klons 2I4 A) zeigt die gelelektrophoretische Auftrennung restringierter genomischer DNA, B) und C) die Autoradiogramme der Sonden 2I4_S1 und 34.28_S1. Die Expositionszeit betrug sieben (B) bzw. sechs (C) Tage. Die Signale des Autoradiogramms sind mit weißen Pfeilen markiert. Als Molekulargewichtsstandards wurde die 1 kb Ladder (M1) und Lambda/HindIII DNA (M2) verwendet. Als drittes und letztes Verfahren wurde eine inverse PCR mit den in Abbildung 3.8 gekennzeichneten Primern „c“ und „d“ durchgeführt. Das PCR-Produkt wurde durch Sequenzierung verifiziert und die in Abbildung 3.8 gezeigte Struktur von 2I4 bestätigt. Durch das Mapping der „mate pairs“, den Analysen durch „long range“ PCR, den genomischen Southern Blots und der inversen PCR konnte gezeigt werden, dass der Klon 2I4 kein in-vitro-Ligat ist und somit der Apfelcontig MDC023034.28 auf Chromosom 4 nicht korrekt annotiert ist. Da der BAC-Klon K65 über eine Länge von 7,3 kb mit dem BAC-Klon 2I4 65 ERGEBNISSE mit 100 %-iger Übereinstimmung überlappt, konnte auch dieser Klon, trotz BLAST-Treffern der Randsequenzen auf Chromosom 4, auf Chromosom 10 positioniert werden. 3.5 Analyse der genomischen Co-Gen-Region 3.5.1 Konstruktion von Metacontigs und eines Gesamtcontigs Als Grundlage für die Rekonstruktion der mit Co gekoppelten genomischen Region in der kolumnaren Apfelsorte P28 wurden die bereits vorhandenen genomischen Sequenzen von GD (Velasco et al. 2010) verwendet. Die Sequenzen der BAC-Klone wurden anhand ihrer BLASTn-Treffer in der Zielregion positioniert. Bereiche, in denen nach den Screenings keine BAC-Klone zur Verfügung standen, wurden mittels „long range“ PCR amplifiziert und anschließend sequenziert. Besonders schwierig gestaltete sich dies an Position 18,68 bis 18,71 Mbp (Chromosom 10) im GD-Genom, da in diesem Bereich keine Contigs annotiert sind und die Lücke zu groß für eine direkte „long range“ PCR war. Daher wurden die „mate pair“-Reads gegen die Ränder der bekannten Sequenz kartiert. Es wurden anschließend die Partner-Reads extrahiert, die in der Lücke liegen. Die Sequenzinformation dieser Partner- Reads war Grundlage zur Erstellung der Primer für die „long range“ PCRs, die letztlich zum Schließen der Lücke führten. Mithilfe von Co-Gen gekoppelten Markern (Kapitel 3.7) konnten einzelne BAC-Klone dem kolumnaren und dem nicht kolumnaren Chromosom zugeordnet werden. Überlappende BAC-Klone wurden entsprechend ihres chromosomalen Ursprungs zu Metacontigs zusammengefügt. Insgesamt konnten 18 Metacontigs gebildet werden, darunter acht des kolumnaren und sechs des nicht kolumnaren Chromosoms. Darüber hinaus wurden die Metacontigs und „long range“ PCR-Produkte in einen etwa 850 kb langen Gesamtcontig zusammengefasst. In Abbildung 3.10 sind die identifizierten und sequenzierten BAC-Klone aus P28, die anhand der GD Referenz und überlappenden Bereichen in Metacontigs und letztlich in einen vorläufigen Gesamtcontig angeordnet werden konnten, dargestellt. Zudem zeigt die Abbildung die Anordnung der Contigs des GD-Genoms und eine grobe Übersicht der dort annotierten Gene. 66 ERGEBNISSE Abbildung 3.10 Co-Zielregion auf Chromosom 10, Position 18 bis 19 Mbp A) zeigt alle BAC-Klone und „long range“ PCR-Produkte aus der Zielregion angeordnet nach ihren BLAST-Treffern. grün: kolumnares Chromosom (BAC); rot: nicht kolumnares Chromosom (BAC); schwarz: kolumnares oder nicht kolumnares Chromosom („long range“ PCR-Produkt); In B) sind die BAC-Klone entsprechend ihrer chromosomalen Zuordnung zusammengefasst als Metacontigs dargestellt. Diese wurden unter anderem für den Vergleich der BAC-Sequenzen mit den Sequenzen des veröffentlichten Apfelgenoms verwendet. C) zeigt den Gesamtcontig, also die Consensus- Sequenz, die entsteht, wenn man alle Sequenzen der BAC-Klone und „long range“ PCR-Produkte beider Chromosomen gemeinsam assembliert. D) stellt die Anordnung der Contigs des GD-Genoms in der Zielregion dar, sowie die dort annotierten Gene (E). Die Grafiken D und E stammen aus dem „apple genome browser“. Anhand genomischer DNA-Sequenzen der Apfelsorte P28 in Form von Illumina „mate pair“- Reads wurde überprüft, ob die Metacontigs und der Gesamtcontig korrekt zusammengesetzt sind und somit die genomische Struktur widerspiegeln. Die zur Verfügung stehenden Reads mit einer statistischen Genomabdeckung von etwa 26-fach, reichten nicht aus, um den Gesamtcontig bei maximaler Mapping-Stringenz lückenlos abzudecken. Allerdings kann durch Verwendung der „mate pair“-Reads eine Aussage darüber getroffen werden, ob die grundsätzliche Zusammensetzung korrekt ist. Insgesamt konnten alle Metacontigs verifiziert werden. Einer genaueren Überprüfung bedurfte es der Region zwischen 240 und 250 kb im Gesamtcontig, die in Abbildung 3.11 dargestellt ist. 67 ERGEBNISSE Abbildung 3.11 Mapping der „mate pair“-Reads gegen den Gesamtcontig Abgebildet ist ein Ausschnitt des Mappings der „mate pair“-Reads gegen den Gesamtcontig. Der rote Pfeil markiert die einzige Position des Mappings, die von keinem „mate pair“-Read überspannt wird. Es handelt sich dabei um die einzige Position im Gesamtcontig, die von keinen „mate pair“- Reads überspannt wird. Dies ist ein Anzeichen dafür, dass diese Stelle im Genom möglicherweise so nicht existiert. An der Position handelt es sich um die etwa 150 bp lange Überlappung zwischen dem Metacontig_3c und dem „long range“ PCR-Produkt LR_Mc_3c_3nc. Das „long range“ PCR-Produkt zeigt starke Übereinstimmung mit dem im GD-Genom annotierten Contig MDC018604.401, was die Vermutung nahe legt, dass es sich um ein Amplifikat des nicht kolumnaren Chromosoms handelt. Der Metacontig_3c stammt hingegen vom kolumnaren Chromosom und weist daher im Vergleich zu den Contigs des GD-Genoms starke Unterschiede auf (Abbildung 3.12). Möglichweise ist dies eine Ursache für die fehlenden Reads. Bisherige Versuche, den Bereich mittels Southern Blot Analysen oder überspannenden „long range“ PCRs zu überprüfen, schlugen fehl, sodass die genomische Organisation an dieser Position nicht abschließend geklärt werden konnte. Der erstellte und abgesehen von der einen unklaren Position verifizierte Gesamtcontig hat eine Länge von 848.024 bp. Insgesamt stammen 539.688 bp (63,64 %) vom kolumnaren Chromosom, 400.968 bp (47,28 %) vom nicht kolumnaren Chromosom und 93.074 bp (10,98 %) aus „long range“ PCR-Produkten, bei denen keine chromosomale Zuordnung möglich ist. 68 ERGEBNISSE 3.5.2 Sequenzvergleiche der Apfelsorten P28 und GD Um Sequenzunterschiede zwischen dem kolumnaren und dem nicht kolumnaren Chromosom zu identifizieren, wurden die Metacontigs der heterozygot kolumnaren Apfelsorte P28 (Abbildung 3.10 B) untereinander und mit den Contigs des GD-Genoms (Abbildung 3.10 D) verglichen. Die Ergebnisse sind in den Abbildungen 3.12 bis 3.14 grafisch dargestellt. Abbildung 3.12 Metacontigs vs. GD-Genom Teil I Gezeigt sind jeweils 125 kb große Ausschnitte aus der Co-Zielregion, die um jeweils 5 kb überlappen. Jeder Bereich besteht aus einem Auszug aus dem „apple genome browser“, in dem die annotierten Contigs (MDCs) und die entsprechenden Positionen im GD-Genom zu sehen sind. Darunter befinden sich die selbst erstellten Metacontigs, deren Lage in Bezug auf das GD-Genom durch gestrichelte Linien gekennzeichnet ist. Indels zwischen den Metacontigs in überlappenden Bereichen sind schraffiert dargestellt. Im untersten Teil sind die Contigs des GD-Genoms entsprechend ihrer Lage in Bezug auf die Metacontigs abgebildet. Schraffierte Flächen in Bereichen der MDCs stehen für fehlende Übereinstimmungen zwischen den MDCs und den dazugehörigen Metacontigs. Darüber hinaus sind die selbst erstellten Co-Gen gekoppelten Marker in den Grafiken in blau dargestellt (Kapitel 3.7). Im Fall von Metacontig 3c handelt es sich bei dem schraffierten Bereich nicht um ein Indel, da eine mögliche Referenz fehlt (Position 18,318 bis 18,33 Mbp). 69 ERGEBNISSE Abbildung 3.13 Metacontigs vs. GD-Genom Teil II Die Erklärung der Abbildung ist der Beschriftung der Abbildung 3.12 zu entnehmen. 70 ERGEBNISSE Abbildung 3.14 Metacontigs vs. GD-Genom Teil III Die Erklärung der Abbildung ist der Beschriftung der Abbildung 3.12 zu entnehmen. Der obere Teil der Abbildung zeigt eine Vergrößerung der Region 18,658 bis 18,753 Mbp, da dort im GD-Genom kaum Contigs annotiert sind und in diesem Bereich drei MDCs neu kartiert werden konnten, die fälschlicherweise Chromosom 4 zugeordnet sind sowie ein MDC, der irrtümlich auf Chromosom 9 annotiert ist. Besonderes Augenmerk liegt auf Indel 19, da dies der einzige Unterschied zwischen dem kolumnaren und nicht kolumnaren Chromosom ist, der durch genomische Illumina-Datensätze der Apfelsorten McIntosh und McIntosh Wijcik bestätigt werden konnte. 71 ERGEBNISSE Insgesamt konnten drei Contigs (MDCs) des GD-Genoms die auf Chromosom 4 und ein Contig, der auf Chromosom 9 annotiert war, nun eindeutig als auf Chromosom 10 lokalisiert bestimmt werden (Abbildung 3.14). Darüber hinaus wurden in der untersuchten Region (18,088 bis 18,923 Mbp) 21 auf Chromosom 10 annotierte GD-Contigs gefunden, die keine Sequenzübereinstimmung mit den Sequenzen der Metacontigs besitzen und somit vermutlich irrtümlich Chromosom 10 zugeordnet wurden. 11 GD-Contigs weisen lediglich Abschnitte auf, die keine Übereinstimmung mit den Metacontigs zeigen; diese Bereiche sind in den Abbildungen 3.12 bis 3.14 schraffiert dargestellt. Insgesamt konnten 21 Indels (> 100 bp) identifiziert werden, wobei 11 einen signifikanten Treffer bei BLASTn-Suchen gegen eine Datenbank transposabler Elemente (CENSOR) ergeben. Bei zwei weiteren Indels handelt es sich um Duplikationen, 8 Indels bleiben uncharakterisiert. Indel 15 ist der einzige Unterschied, der auf Sequenzvergleichen zwischen einem Metacontig des nicht kolumnaren Chromosoms und einem Contig des GD-Genoms beruht. Alle weiteren Indels beruhen entweder auf Unterschieden zwischen kolumnaren und nicht kolumnaren Metacontigs oder auf Unterschieden zwischen kolumnaren Metacontigs und Contigs des GD-Genoms (Tabelle 3.11). Diese Indels könnten potenziell mit der Co-Mutation assoziiert sein. Zur Überprüfung möglicher Unterschiede zwischen kolumnarem und nicht kolumnarem Chromosom wurden die Apfelsorten McIntosh und McIntosh Wijcik verwendet, da der einzige genomische Unterschied zwischen diesen beiden Sorten sehr wahrscheinlich die Co-Mutation ist. Genomische Illumina-Datensätze der Apfelsorten McIntosh und McIntosh Wijcik (Doktorarbeit Romina Petersen, IMSB) wurden gegen den Gesamtcontig kartiert. Anschließend wurden die Integrationsstellen der Indels untersucht. Werden diese von „paired reads“ überspannt, so kann man davon ausgehen, dass das Indel an dieser Position in der entsprechenden Apfelsorte vorhanden ist. Im gegenteiligen Fall ist von einem Fehlen des Indels auszugehen. Von Interesse sind Indels, die Unterschiede zwischen McIntosh und McIntosh Wijcik aufweisen. In Tabelle 3.11 sind die Ergebnisse der Mappings und der Charakterisierung der Indels aufgeführt. 72 ERGEBNISSE Tabelle 3.11 Identifizierte Indels in der Co-Zielregion Indel CENSOR Treffer Quelle Mapping McIntosh Mapping McIntosh Wijcik 1 - c ↔ GD vorhanden vorhanden 2 RTE-1B_Mad c ↔ GD vorhanden vorhanden 3 DNA9-3_Mad c ↔ GD vorhanden vorhanden 4 - c ↔ nc u. GD vorhanden vorhanden 5 (Duplikation) c ↔ GD vorhanden vorhanden 6 hAT-4_Mad c ↔ GD vorhanden vorhanden 7 - c ↔ nc nicht vorhanden nicht vorhanden 8 - c ↔ GD vorhanden vorhanden 9 (Duplikation) c ↔ GD vorhanden vorhanden 10 - c ↔ GD vorhanden vorhanden 11 Gypsy-36_Mad LTR c ↔ GD vorhanden vorhanden 12 DNA3-3D_Mad c ↔ GD vorhanden vorhanden 13 RTE-1_Mad c ↔ nc nicht vorhanden nicht vorhanden 14 RTE-1_Mad c ↔ GD vorhanden vorhanden 15 - nc ↔ GD vorhanden vorhanden 16 Copia-59_Mad c ↔ GD vorhanden vorhanden 17 - lr ↔ GD vorhanden vorhanden 18 Gypsy-18_Mad lr ↔ GD vorhanden vorhanden 19 Gypsy-44_Mad c ↔ nc u. GD nicht vorhanden vorhanden 20 RTE-1_Mad c ↔ nc nicht vorhanden nicht vorhanden 21 - c ↔ nc u. GD vorhanden vorhanden c: kolumnarer Metacontig (Mc); nc: nicht kolumnarer Mc; lr: „long range“ PCR-Produkt Der einzige Unterschied, der anhand der genomischen Daten von McIntosh und McIntosh Wijcik bestätigt wird, liegt in der Ab- bzw. Anwesenheit des Transposons Gypsy-44 (Indel 19) an Position 18,79 auf Chromosom 10 (Abbildung 3.14). Nur in der Apfelsorte McIntosh Wijcik ist das Transposon an dieser Stelle lokalisiert. Die genomische Struktur und die Integrationsstelle von Gypsy-44 liegen in Form von Metacontig_7c und Metacontig_7nc für das kolumnare und nicht kolumnare Chromosom vor und wurden in Zusammenarbeit mit Romina Petersen (IMSB) genauer analysiert. In Abbildung 3.15 ist die genomische Situation dieses Locus schematisch dargestellt. Gypsy-44 liegt in 3‘-5‘-Orientierung im 5‘-LTR eines Gypsy-33 Retrotransposons. 73 ERGEBNISSE Abbildung 3.15 Gypsy-44 in der Region um 18,79 Mbp auf Chromosom 10 Der obere Teil der Abbildung zeigt die genomische Lage des Transposons Gypsy-44 (rot) auf Chromosom 10 für das kolumnare Chromosom. Das Transposon befindet sich im 5‘-LTR eines weiteren transposablen Elements (Gypsy-33, grün). Weitere Elemente der Transposons sind eingezeichnet, wie „target site (TS)“, „primer binding site (PBS)“, „polypurine tract (PPT)“, „open reading frame (ORF)“ und „long terminal repeat (LTR)“. Der untere Teil der Abbildung spiegelt die genomische Situation der Region um 18,79 Mbp im nicht kolumnaren Chromosom wider. Bei Gypsy-44 und Gypsy-33 handelt es sich um LTR-Retrotransposons. Die typischen Elemente der Transposons wie „long terminal repeats“, „target site duplications“, „primer binding sites“ und „polypurine tracts“ konnten identifiziert werden. Beide Transposons enthalten einen ORF. Dabei handelt es sich im Fall von Gypsy-33 vermutlich um ein gag- verwandtes Gen. Bei dem ORF von Gypsy-44 konnte jedoch keine Funktion oder Domäne identifiziert werden. Da die für die Transposition benötigten Gene nur teilweise oder gar nicht vorhanden sind, handelt es sich bei Gypsy-44 und Gypsy-33 vermutlich um nicht- autonome Elemente. Um zu verifizieren, dass das Transposon Gypsy-44 nur bei kolumnaren Apfelsorten vorkommt, wurden Primer entworfen, die die rechte und linke Integrationsstelle sowie das komplette Transposon überspannen. Es konnte gezeigt werden, dass Gypsy-44 an dieser Position ausschließlich bei den heterozygot kolumnaren Apfelsorten McIntosh Wijcik und P28 auftritt, bei den nicht kolumnaren Apfelsorten McIntosh und A14 jedoch fehlt. Die detaillierten Ergebnisse der PCRs sind in Kapitel 3.7.4 dargestellt. Alle anderen Indels aus Tabelle 3.11 sind an den entsprechenden Positionen sowohl in McIntosh wie auch in McIntosh Wijcik vorhanden oder nicht vorhanden und somit vermutlich nicht mit der Co-Mutation assoziiert. 74 ERGEBNISSE 3.5.3 Annotation von Genen und transposablen Elementen Zur Annotation der Gene im Gesamtcontig wurden die CDS der GDR-Datenbank, sowie zwei Transkriptomdatensätze des Sprossapikalmeristems der Apfelsorte P28 von Clemens Krost (2012) verwendet. In Abbildung 3.16 sind die annotierten Gene im Gesamtcontig abgebildet. Abbildung 3.16 Annotierte Gene im erstellten Gesamtcontig Die Grafik zeigt, welche Gruppen von Genen in welcher Anzahl im Gesamtcontig identifiziert werden konnten. Die einzelnen Gene sind gruppiert in solche, die durch die Transkriptomdaten (TD) nur gering oder gar nicht abgedeckt sind, in Gene, die durch die TD verifiziert werden konnten und in solche, deren Annotation aufgrund der TD geändert wurde. Drei Gene wurden von Romina Petersen (IMSB) identifiziert und stammen somit nicht aus den im GD-Genom annotierten CDS. Insgesamt konnten 83 Gene im Gesamtcontig annotiert werden. 38 dieser Gene sind durch die Transkriptomdaten gar nicht oder zu gering abgedeckt, um Aussagen über die Struktur der Gene zu machen zu können. Aus diesem Grund wurden diese Gene entsprechend ihrer Annotation im GD-Genom übernommen. Bei 15 Genen konnte die Annotation des GD- Genoms durch die Transkriptomdaten verifiziert werden. Drei Gene wurden durch Romina Petersen im Rahmen ihrer Doktorarbeit charakterisiert. Bei 27 Genen wurde anhand der Transkriptomdaten die Exon-Intron-Struktur im Vergleich zur GD-Annotation korrigiert und entsprechend annotiert. In einigen Fällen besteht die Vermutung, dass es sich bei den annotierten CDS des GD-Genoms möglicherweise um zwei oder sogar drei getrennte Transkripte handelt, da die 3‘-Bereiche der Gene in den Mappings überproportional stark abgedeckt sind. Dies ist sehr wahrscheinlich auf die zweimalige Selektion mittels oligo(dT)- Affinitätsaufreinigung (Poly-A+-RNA und anschließende Amplifikation) bei der cDNA- 75 ERGEBNISSE Synthese zurückzuführen (Krost 2012). Eine vollständige Liste der selbst annotierten Gene befindet sich im elektronischen Anhang. In Bezug auf das GD-Genom erstreckt sich der erstellte Gesamtcontig von Position 18,088 bis 18,923 Mbp auf Chromosom 10. In diesem Bereich sind 84 Gene vorhergesagt. Detaillierte Angaben zu diesen Genen sind Tabelle 3.12 zu entnehmen. Die ersten beiden Spalten beziehen sich auf die CDS-Datensätze der GDR-Datenbank, die Spalten drei bis fünf auf die Überprüfung der Annotationen basierend auf den zwei Transkriptomdatensätzen des Sprossapikalmeristems der Apfelsorte P28. Die detaillierte Analyse der Gene in der Zielregion und Genexpressionsstudien zwischen P28 und A14 sowie zwischen McIntosh und McIntosh Wijcik waren nicht Teil dieser Arbeit, sondern der Arbeiten von Clemens Krost (2012) und Romina Petersen. 76 ERGEBNISSE 77 Tabelle 3.12 Im GD-Genom annotierte Gene in der Zielregion CDS Bemerkung 1 TD geänderte Annotation Bemerkung 2 MDP0000423953  MDP0000423954  MDP0000244450 Pseudogen  MDP0000244450-like MDP0000320862 identisch mit MDP0000244450, zusätzlicher Teil nicht Chr.10 MDP0000423958  MDP0000320861 Pseudogen  MDP0000320861-like, -like2 und -like3 vermutlich 3 getrennte Transkripte MDP0000232611 3‘-Splice-Site vor Exon 14 fehlt  MDP0000232611-like Exon 1 bis 7 aus GD-Annotation, Intron in 3'-UTR MDP0000286153 MDP0000303750 Contigs im GD-Genom falsch annotiert (MDC011474.622 und MDP0000169714 MDC003942.376), Gene nicht annotiert MDP0000169715 MDP0000320859  MDP0000320859-like MDP0000326734  MDP0000169210  MDP0000436968 Gene identisch  MDP0000706741 MDP0000304842 5‘-Splice-Site nach Exon 2: CG,  MDP0000303255 3‘-Splice-Site vor Exon 4: AC, Splice-Variante  MDP0000304842-like 2 Introns im 3'-UTR MDP0000238679 Splice-Variante  MDP0000301481 3‘-Splice Site vor Exon 4: AC, BLAST-Treffer Chr. 0, Splice-Variante  MDP0000303254  MDP0000303254-like MDP0000304843 Splice-Variante zu MDP0000303254  MDP0000208936 Pseudogen  MDP0000350168  MDP0000205935  MDP0000205933 3‘-Splice-Site vor Exon 2: AT  MDP0000908448  MDP0000301011  MDP0000301010  MDP0000301010-like Splice-Variante identifiziert MDP0000205928  MDP0000205928-like MDP0000165198 Gene identisch  MDP0000265747 : nicht exprimiert : exprimiert, geringe Abdeckung : exprimiert, wie annotiert : exprimiert, geänderte Annotation TD: Transkriptomdaten ERGEBNISSE 78 CDS Bemerkung 1 TD geänderte Annotation Bemerkung 2 MDP0000214784  MDP0000214784-like Intron in 3'-UTR, 2 Varianten an 3'-UTRs MDP0000294006 Gen nicht annotiert, kein Start- und Stopp-Codon MDP0000641747  MDP0000641747-like MDP0000307618  MDP0000307618-like MDP0000307619  MDP0000308878  MDP0000771589  MDP0000343332 Gen nicht annotiert, kein Start- und Stopp-Codon MDP0000771587  MDP0000771587-138428-like vermutlich ein langes Transkript MDP0000138428 SNP im Stopp-Codon: TTA  MDP0000138427  MDP0000138427-like MDP0000214259  MDP0000214258  MDP0000214257  MDP0000255817 Pseudogen (BLAST-Treffer Chr. 11)  MDP0000697030  MDP0000697030-like MDP0000191925  MDP0000191926  MDP0000253723  MDP0000170185 Splice-Variante zu MDP0000253723  MDP0000342057 BLAST-Treffer auf Chr. 5  MDP0000342057-like Pseudogen MDP0000513356 Exon 3 (~50% des Gens) nicht vorhanden, Gen nicht annotiert MDP0000784187  Contig im GD-Genom falsch annotiert (MDC007650.539), Gen MDP0000136351 nicht annotiert MDP0000157859 Pseudogen  MDP0000157859-like MDP0000706530  MDP0000271350  MDP0000271350-like und -like2 vermutlich 2 getrennte Transkripte MDP0000143705  MDP0000143705-like MDP0000254096  MDP0000254096-like und -like2 vermutlich 2 getrennte Transkripte MDP0000234557  MDP0000326311 Gen nicht annotiert, kein Start- und Stopp-Codon MDP0000897594  MDP0000897594-like MDP0000136858  : nicht exprimiert : exprimiert, geringe Abdeckung : exprimiert, wie annotiert : exprimiert, geänderte Annotation TD: Transkriptomdaten ERGEBNISSE 79 CDS Bemerkung 1 TD geänderte Annotation Bemerkung 2 MDP0000524262  vermutlich 2 getrennte Transkripte; beide PolyA- MDP0000284965 Pseudogen  MDP0000284965-like und -like2 Signale vorhanden MDP0000367163  MDP0000329966  MDP0000508371  MDP0000942873  MDP0000186457  MDP0000324960 Pseudogen (BLAST-Treffer Chr. 7)  MDP0000855671  MDP0000154627  MDP0000369268 BLAST-Treffer Chr. 11  MDP0000273398 MDP von Chromosom 9  MDP0000286915  MDP0000187369  At1g08530-like von Romina Petersen annotiert  MDP0000766466 Stopp-Codon: TAG (nicht kolumnares Chr.), CAG (kolumnares Chr.)  Downy Mildew von Romina Petersen annotiert  Resistant 6-like MDP0000362327 BLAST-Treffer auf Chr. 0  MDP0000464120 BLAST-Treffer Chr. 1  MDP0000927098  MDP0000187760 SNP verändert Stopp-Codon  MDP0000927091  Exon 1 in TD nicht abgedeckt MDP0000287209 Start-Codon: ATG (nicht kolumnares Chr.), ATA (kolumnares Chr.)  Auxin-induced von Romina Petersen annotiert  Splice-Variante identifiziert protein 5NG4-like MDP0000912172  MDP0000139773  MDP0000934869  MDP0000934866  MDP0000934866-like MDP0000163720  MDP0000269126 nur ersten zwei Exons vorhanden  : nicht exprimiert : exprimiert, geringe Abdeckung : exprimiert, wie annotiert : exprimiert, geänderte Annotation TD: Transkriptomdaten ERGEBNISSE Transposable Elemente machen 42,4 % des Apfelgenoms aus (Velasco et al. 2010). Zur Identifizierung transposabler Elemente im Gesamtcontig wurden die Programme CENSOR und LTR-Finder verwendet. Insgesamt wurden im Gesamtcontig 160 Transposons und ein Virus detektiert und annotiert. Die Klassifizierung transposabler Elemente ist variabel, meist werden sie in die zwei Klassen Retrotransposons (Klasse I) und DNA-Transposons (Klasse II) unterteilt (Finnegan 1989). Die Retrotransposons lassen sich wiederum in die Gruppen LTR- Retrotransposons und Non-LTR-Retrotransposons untergliedern. Die 160 identifizierten transposablen Elemente unterteilen sich in 66 DNA-Transposons, 68 LTR-Retrotransposons und 26 Non-LTR-Transposons (Abbildung 3.17). Abbildung 3.17 Annotierte transposable Elemente in der Zielregion Die annotierten transposablen Elemente sind in dieser Abbildung in die Klasse der DNA-Transposons (rot) und Retrotransposon unterteilt, wobei die Retrotransposons nochmals in LTR- (grün) und Non- LTR-Retrotransposons (blau) untergliedert werden. Zudem sind aus der Abbildung die Vertreter der einzelnen Klassen nochmals in Untergruppen eingeteilt. Die jeweilige Anzahl der annotierten transposablen Elemente ist hinter der Bezeichnung gezeigt. Die LTR-Retrotransposons setzen sich aus den Hauptvertretern Copia und Gypsy sowie einer Gruppe uncharakterisierter LTR-Retrotransposons (andere) zusammen. Gypsy-LTR- Retrotransposons machen mit 15 den größten Teil dieser Gruppe aus, gefolgt von Copia- 80 ERGEBNISSE LTR-Retrotransposons mit 12 Vertretern. Darüber hinaus wurden 31 solo-LTRs identifiziert. Diese entstehen bei Rekombinationsereignissen zwischen den LTRs der LTR- Retrotransposons (Vitte und Panaud 2005). Die Non-LTR-Retrotransposons lassen sich untergliedern in SINEs und LINEs. Es konnten 15 SINEs und insgesamt 11 LINEs identifiziert werden. Der Hauptvertreter der LINEs sind „retrotransposable elements (RTEs)“ (Malik und Eickbush 1998). Die DNA-Transposons bestehen zum größten Teil (46 von 66) aus uncharakterisierten transposablen Elementen (andere). Es konnten aber auch Vertreter der Gruppen hAT-type, MuDR, Harbinger und Helitrons identifiziert werden. Die annotierten transposablen Elemente machen mit 337.972 bp etwa 40 % des Gesamtcontigs aus, dabei stellen die LTR-Retrotransposons mit rund 74 % den größten Anteil dar. In Abbildung 3.18 ist die Verteilung der annotierten transposablen Elemente bezüglich ihrer Größe dargestellt. Abbildung 3.18 Größenverteilung der annotierten transposablen Elemente Die Diagramme zeigen die Verteilung der transposablen Elemente bezüglich ihrer Größe untergliedert in die Klassen DNA-Transposons, LTR-Retrotransposons und Non-LTR- Retrotransposons. Die Größe der einzelnen Gruppen ist in Basenpaaren angegeben. Insgesamt machen die transposablen Elemente 337.972 bp und damit 40 % des Gesamtcontigs aus. 81 ERGEBNISSE Von den 160 transposablen Elementen handelt es sich bei 12 lediglich um Teilfragmente transposabler Elemente, die annotiert wurden. Solo-LTRs, die durch ungleiche homologe Rekombination entstehen, spielen bei Betrachtung der „target site duplication (TSD)“ eine gesonderte Rolle. Findet das Rekombinationsereignis zwischen den LTRs eines Retrotransposons statt, entsteht ein solo-LTR mit konservierter TSD des Retrotransposons. Bei einem Ereignis zwischen den LTRs zweier Retrotransposons hingegen entsteht ein solo- LTR mit unterschiedlichen „target sites“ (Vitte und Panaud 2005). Bei den annotierten solo- LTRs ist lediglich in sechs von 32 Fällen eine konservierte TSD zu identifizieren. Abzüglich der Teilfragmente transposabler Elemente und der solo-LTRs verbleiben 116 annotierte transposable Elemente, von denen zehn keine TSD aufweisen, 14 zeigen eine TSD mit einem Nukleotidaustausch und 92 besitzen eine perfekte TSD. Außer der TSD sind insbesondere die LTRs bei LTR-Retrotransposons eine auffällige Struktureigenschaft. Die Sequenzen der LTRs sind bei der Integration des Transposons in der Regel identisch, weichen aber mit der Zeit unter anderem durch Substitution einzelner Basen immer mehr voneinander ab (SanMiguel et al. 1998). Den exakten Zeitpunkt der Integration zu bestimmen ist sehr schwierig, allerdings kann die Sequenzidentität genutzt werden, um ungefähr abschätzen zu können, ob ein LTR-Retrotransposon schon vor längerer Zeit oder erst kürzlich ins Genom integrierte. Die Sequenzübereinstimmung der LTRs der in dieser Arbeit annotierten Retrotransposons liegt durchschnittlich bei 91 %. Interessant ist jedoch das Retrotransposon Gypsy-44 an Position 18,79 auf Chromosom 10: Die LTRs sind 100 %-ig identisch, was vermuten lässt, dass die Integration an dieser Position erst vor kurzem stattgefunden hat. Im elektronischen Anhang befinden sich die detaillierten Ergebnisse der BLAST-Suchen mittels CENSOR gegen die Repeat-Datenbank „Repbase“ sowie weitere Details zu den annotierten transposablen Elementen. Zusammenfassend ist in den Abbildungen 3.19 und 3.20 der Gesamtcontig mit den annotierten transposablen Elementen und Genen dargestellt, um einen Überblick über deren Verteilung zu erhalten. Auffällig ist, dass transposable Elemente bevorzugt in genarmen Regionen vorkommen (Abbildung 3.19). Transposable Elemente, die in Genbereiche integrierten, liegen überwiegend in Intron- Bereichen. Zudem kommt es häufig vor, dass Transposons in andere Transposons integrieren (Abbildung 3.20). 82 ERGEBNISSE 83 Abbildung 3.19 Annotierte Gene und transposable Elemente im Gesamtcontig Teil I Der dargestellte erste Teil des Gesamtcontigs zeigt eine hohe Gendichte mit einem geringen Anteil an transposablen Elementen. Bei den LTR-Retrotransposons sind die LTRs gesondert annotiert. ERGEBNISSE 84 Abbildung 3.20 Annotierte Gene und transposable Elemente im Gesamtcontig Teil II Der zweite Teil des Gesamtcontigs ist überwiegend durch Transposons charakterisiert. Auffällig ist zudem der Bereich von 608 bis 640 kb, in dem drei Retrotransposons ineinander verschachtelt liegen. Bei den LTR-Retrotransposons sind die LTRs gesondert annotiert. ERGEBNISSE 3.7 Molekulare Co-Gen gekoppelte Marker 3.7.1 Identifikation Co-Gen gekoppelter Marker Durch Sequenzvergleiche überlappender BAC-Sequenzen der heterozygot kolumnaren Apfelsorte P28 und Vergleiche dieser mit Sequenzen des GD-Genoms konnten zahlreiche Indels identifiziert werden. Diese können als potenzielle Marker zur Unterscheidung von kolumnaren und nicht kolumnaren Apfelbäumen dienen. Indel-flankierende Primer wurden erstellt und PCRs auf genomische DNAs der Sorten P28 und A14 durchgeführt. Die Benennung der Marker erfolgte gemäß den BAC-Klonen, in denen die Indels identifiziert wurden. In Tabelle 3.13 sind die potenziellen Marker mit erwarteter Fragmentgröße für das kolumnare und das nicht kolumnare Chromosom und die genomische Lage aufgelistet. Tabelle 3.13 Potenzielle Co-Gen gekoppelte Marker erwartete Fragmente Marker genomische Region kolumnar nicht kolumnar 1C3_M1 18,909 Mbp 348 bp 307 bp 1C3_M2 18,902 Mbp 414 bp 248 bp A4_3_M1 18,818 Mbp 120 bp 152 bp K2_3_M1 18,806 Mbp 642 bp 519 bp I2_3_M1 18,767 Mbp 143 bp 126 bp I2_3_M2 18,750 Mbp 286 bp 256 bp 2I4_M1 18,677 Mbp 945 bp 333 bp 2I8_M1 18,637 Mbp 238 bp 204 bp D4_M1 18,562 Mbp 149 bp 179 bp G5_M1 18,550 Mbp 225 bp 241 bp H1_M1 18,514 Mbp 128 bp 206 bp H1_M2 18,512 Mbp 261 bp 246 bp K25_M1 18,304 Mbp 136 bp 157 bp In der gelelektrophoretischen Auftrennung der PCR-Produkte sollte die heterozygot kolumnare Apfelsorte P28 zwei Banden zeigen, eine in Höhe des erwarteten kolumnar- spezifischen Produkts und eine Bande in Höhe des nicht kolumnar-spezifischen Produkts. Die homozygot nicht kolumnare Apfelsorte A14 sollte nur eine Bande in Höhe des nicht kolumnar-spezifischen Fragments aufweisen. Die Ergebnisse sind in Abbildung 3.21 dargestellt. 85 ERGEBNISSE Abbildung 3.21 Potenzielle Co-Gen gekoppelte Marker Die Bilder zeigen die Ergebnisse von Agarosegelelektrophoresen der PCR-Produkte der potenziellen Marker. Marker, die eindeutige Unterschiede zwischen A14 und P28 aufzeigen und sich somit möglicherweise zur Differenzierung zwischen kolumnarem und nicht kolumnarem Chromosom eignen, sind in grün dargestellt. Das kolumnar-spezifische PCR-Produkt ist grün eingerahmt. Als Molekulargewichtsstandards wurde die 50 bp und 100 bp Ladder genutzt. Es konnten insgesamt 10 der 13 potenziellen Marker verifiziert werden. Sie zeigen die erwarteten eindeutigen Unterschiede zwischen A14 und P28. Allerdings tritt bei PCRs auf genomische P28-DNA mehrfach neben den erwarteten zwei Amplifikaten und möglichen unspezifischen Produkten eine weitere, distinkte dritte Bande auf (Abbildung 3.21). Da die Chromosomen-spezifischen Unterschiede in der Regel sehr gering sind (< 50 bp), liegt die Vermutung nahe, dass es sich bei der dritten Banden um ein Hybrid aus den anderen zwei Banden handelt. Die homologen Bereiche der zwei Amplifikate lagern sich während der Abkühlphase des PCR-Zyklus zusammen und die Insertion bildet eine Schleife. Dies wurde mittels S1-Nuklease-Verdau untersucht. Die S1-Nuklease entfernt solche einzelsträngigen Schleifen. In Abbildung 3.22 ist der Verdau für drei ausgewählte Marker gezeigt. Die in PCRs auf genomische P28-DNA auftretende dritte Bande ist nach S1-Nuklease-Behandlung nicht mehr zu detektieren. Damit konnte gezeigt werden, dass es sich bei der dritten Bande höchstwahrscheinlich um ein Hybrid der anderen zwei Banden gehandelt hat. 86 ERGEBNISSE Abbildung 3.22 S1-Nuklease-Verdau ausgewählter Co-Gen gekoppelter Marker Das Gelbild zeigt die Auftrennung der PCR-Produkte Co-Gen gekoppelter Marker nach erfolgtem S1- Nuklease-Verdau (S1) und anschließender Fällung. Zudem sind die PCR-Produkte ohne S1-Nuklease- Verdau gelelektrophoretisch aufgetrennt. Als Molekulargewichtsstandard (M) diente die 50 bp Ladder. Die Hybridbande und die entsprechende Stelle nach S1-Nuklease-Verdau sind grün eingerahmt. Zur weiteren Markeranalyse wurden die sechs Marker K25_M1, H1_M1, 2I4_M1, I2_3_M1, A4_3_M1 und 1C3_M2 verwendet. Um abschließend zu überprüfen, ob die erhaltenen PCR- Produkte tatsächlich von den zu untersuchenden Loci stammen, wurden die Amplifikate einer PCR auf genomische DNA der Apfelsorten P28 und A14 in pGEM-T Vektor kloniert und anschließend sequenziert. Durch BLASTn-Suchen der Sequenzen gegen das GD-Genom konnten alle Amplifikate der sechs Marker der entsprechenden Region auf Chromosom 10 zugeordnet werden. Um zu überprüfen, ob es sich bei den identifizierten Markern tatsächlich um kolumnar-spezifische Unterschiede handelt, wurde eine Nachkommenschaft einer Kreuzung der Apfelsorten P28 und A14 analysiert. Entscheidend dabei war, ob die zweite Bande aus P28 nur bei Nachkommen mit kolumnarem Phänotyp in der PCR auftritt und somit kolumnar-spezifisch ist. 87 ERGEBNISSE 3.7.2 Feinkartierung der Zielregion Die genomischen DNAs von 95 Nachkommen (48 kolumnare, 47 nicht kolumnare) einer Kreuzung der Apfelsorten P28 und A14 dienten der Analyse der Co-Gen gekoppelten Marker. Zunächst wurde jedoch die grobe Abschätzung der Zielregion (Kapitel 3.1) durch Tests der 95 Nachkommen mit diversen Markern verfeinert. Dazu wurden PCRs mit den publizierten Markern Ch03d11, Hi01a03, SCAR216, SCAR682 (Abbildung 1.3) und dem selbst erstellten Marker K25_M1 durchgeführt und mittels QIAxcel elektrophoretisch aufgetrennt. Die Ergebnisse sind im Anhang A3 abgebildet, die kompletten Daten befinden sich im elektronischen Anhang. Der Marker SCAR682 wurde für die Auswertung verworfen, da die PCRs keine zuverlässig reproduzierbaren Egebnisse lieferten. Der Marker Ch03d11 zeigt für alle kolumnaren und nicht kolumnaren Nachkommen das erwartete Bandenmuster mit Ausnahme des Nachkommen 8.21 N. Dieser Nachkomme zeigt einen normalwüchsigen Phänotyp (N), allerdings das kolumnare Bandenmuster. Dies entspricht einer Rekombinationsrate des Markers mit dem Co-Gen von 1,05 %. Der Marker Hi01a03 zeigt drei (7.99 C, 6.40 N und 7.17 N), der Marker SCAR216 sechs (7.99 C, 6.40 N, 7.17 N, 8.17 C, 7.2 N und 8.8 N) Nachkommen, bei denen das Bandenmuster nicht dem Phänotyp entspricht. Dies kommt einer Rekombinationsfrequenz der Marker von 3,16 % und 6,32 % gleich. Der selbst hergestellte Marker K25_M1 zeigt hingegen bei allen PCRs das erwartete Bandenmuster und weist somit 100 % Kopplung mit dem Co-Gen auf. Neben der Analyse des Markers K25_M1 wurde der Marker 1C3_M2 auf insgesamt 115 Nachkommen (55 kolumnare, 60 nicht kolumnare) einer Kreuzung der Apfelsorten P28 und A14 durch PCR und anschließende gelelektrophoretische Auftrennung getestet (Gelbilder nicht gezeigt). Alle Nachkommen zeigen das erwartete Bandenmuster, sodass der Marker 1C3_M2 wie bereits K25_M1 eine 100 %-ige Kopplung mit Co zeigt. Die noch verbleibenden Marker H1_M1, 2I4_M1, I2_3_M1 und A4_3_M1 wurden aufgrund des begrenzten Materials sowie aus Zeit- und Kostengründen auf insgesamt nur zehn Einzelnachkommen (5 kolumnare, 5 nicht kolumnare) getestet. Unter den zehn Nachkommen befinden sich die „Ausreißer“ der Marker Ch03d11 und Hi01a03 und zwei des Markers SCAR216. Alle Marker zeigen bei den getesteten Nachkommen das erwartete Bandenmuster, wodurch man von einer 100 %-igen Kopplung mit dem Co-Gen ausgehen kann (Gelbilder nicht gezeigt). Die Ergebnisse bzw. die daraus abgeleitete Kopplungskarte sind in Abbildung 3.23 zusammengefasst. 88 ERGEBNISSE Abbildung 3.23 Feinkartierung der Co-Zielregion Die Abbildung zeigt die Ergebnisse der Markeranalysen der Nachkommenschaft einer Kreuzung der Apfelsorten A14 x P28. Neben der chromosomalen Lage sind die Rekombinationsfrequenzen (RF) der Marker abgebildet. * Tian et al. (2005) ** Moriya et al. (2009) *** Liebhard et al. (2002) Obwohl die zur Verfügung stehende Nachkommenschaft mit den getesteten 95 Nachkommen sehr klein ist, konnte anhand der Markeranalysen eine Grenze der Zielregion verfeinert werden. Wie in Abbildung 3.23 zu sehen, zeigt der Marker Ch03d11 eine Rekombinationsfrequenz von 1,05 %, der Marker K25_M1 hingegen eine vollständige Kopplung mit Co. Die Grenze der Co-Region in Richtung 18 Mbp auf Chromosom 10 liegt somit bei 18,228 Mbp (Ch03d11). Um die Zielregion in Richtung 19 Mbp zu verfeinern, wurden PCRs mit den Markern C6835.384-2 (Pos. 19,457 Mbp), C7629-22009 (Pos. 19,095) und C18470-25831 (Pos. 19,004) von Bai et al. (2012) sowie mit dem Marker Mdo.chr10.15 (Pos. 18,962) von Moriya et al. (2012) durchgeführt (Abbildung 1.3). Die gelelektrophoretische Auftrennung ausgewählter PCR-Produkte ist in Abbildung 3.24 dargestellt. 89 ERGEBNISSE Abbildung 3.24 Markertests zur Feinkartierung der Zielregion Gezeigt sind Gelbilder der Markertests zur Feinkartierung der Zielregion in Richtung 19 Mbp. Als Vergleich zu den „Ausreißern“ dient genomische P28- und A14-DNA. Die Proben der Apfelbäume mit kolumnarem Phänotyp sind unterstrichen. Das kolumnar-spezifische PCR-Produkt ist grün eingerahmt. Die Marker C7629-22009 und C6835.384-2 zeigen keine Unterschiede zwischen kolumnarem und nicht kolumnarem Genotyp und wurden somit verworfen (Gelbilder nicht abgebildet). Bei dem Marker Mdo.chr10.15 ist eine eindeutige Zuordnung der PCR- Produkte zu dem kolumnaren Chromosom, selbst nach mehreren Sequenzierungen, nicht möglich. Daher wurden neue Primer erstellt (Mdo.chr10.15-like), die den gewünschten Locus auf Chromosom 10 spezifisch amplifizieren. Auch wenn bei dem Nachkommen 8.17 das kolumnar-spezifische PCR-Produkt nur sehr schwach ist, zeigen alle untersuchten „Ausreißer“ den ihrem Phänotyp entsprechenden Genotyp. Gleiches gilt für den Marker C18470-25831. Sowohl der Marker Mdo.chr10.15-like wie auch der Marker C18470-25831 zeigen somit 100 % Kopplung mit dem Co-Gen, sodass keine weitere Feinkartierung in Richtung 19 Mbp erreicht werden konnte. 90 ERGEBNISSE 3.7.3 Markeranalysen anderer Apfelsorten Neben den Apfelsorten P28 und A14 wurden die neu entwickelten Marker auf fünfzehn kolumnare und sechs nicht kolumnare Apfelsorten getestet. Durch die Verwendung weiterer Apfelsorten sollte untersucht werden, ob die erstellten Marker spezifisch für P28 bzw. A14 oder ob sie sortenunabhängig anwendbar sind. In Tabelle 3.14 sind die Ergebnisse der Markertests zusammengefasst. Eine Darstellung der PCR-Analysen befindet sich im Anhang in Abbildung A4.1. Tabelle 3.14 Markertests auf diverse Apfelsorten Apfelsorte K25_M1 H1_M1 I2_3_M1 1C3_M2 kolumnar: Procats 1 ho c he c ho c ho c Procats 4 he c he c he c he c Procats 11 he c he c he c he c Procats 13 he c he c he c he c Procats 27 he c he c he c he c Procats 28 he c he c he c he c Greencats he c he c he c he c Pomforyou he c he c he c he c Pomfital he c he c he c he c Kordonia ho c he c ho c ho c A10-28 he c he c he c he c A68-173 ho c he c ho c ho c A73-19-93K ho c ho c ho c ho c McIntosh Wijcik ho c he c ho c ho c Pomgold he c he c he c he c HL 4 K ho c he c ho c ho c nicht kolumnar: McIntosh ho c he c ho c ho c Elswout ho nc ho nc ho nc ho nc Gala ho nc ho nc ho nc ho nc Jonagold he c ho nc ho nc he c Pinova he c ho nc ho nc he c Topaz he c he c he c he c A14-190-93 ho nc ho nc ho nc ho nc he: heterozygot; ho: homozygot; c: kolumnar; nc: nicht kolumnar Die Apfelsorten sind in Tabelle 3.14 anhand ihres Phänotyps in kolumnar und nicht kolumnar unterteilt. In den Spalten zwei bis vier sind die Genotypen der Apfelsorten in Bezug auf den jeweilig verwendeten Marker angegeben. Die homozygote Apfelsorte A73- 19-93K (Co/Co) zeigt für jeden der verwendeten Marker erwartungsgemäß das homozygot kolumnare Bandenmuster. Die Sorten McIntosh und McIntosh Wijcik zeigen für die jeweiligen Marker dasselbe Bandenmuster. Dies verwundert nicht, da es sich bei McIntosh Wijcik um eine somatische Mutante von McIntosh handelt und der einzige Unterschied 91 ERGEBNISSE zwischen den beiden Sorten höchstwahrscheinlich die Co-Mutation ist. Die verwendeten Marker detektieren bei zahlreichen Apfelsorten den erwarteten Genotyp, wie etwa bei Gala und Elswout. Allerdings gibt es auch einige Apfelsorten, bei denen die Marker nach PCR nicht den erwarteten Genotyp zeigen, was gegen eine Sortenunabhängigkeit der Marker spricht. Eine besondere Rolle spielt die Apfelsorte Topaz. Für jeden der vier Marker zeigt sie den heterozygot kolumnaren Genotyp, obwohl der Phänotyp von Topaz eindeutig nicht kolumnar ist. Ausgewählte Co-Gen gekoppelte Marker anderer Arbeitsgruppen wurden daraufhin auf genomische DNA des Kultivars Topaz getestet (Abbildung 3.25). Für jeden dieser Marker zeigt die Sorte Topaz den heterozygot kolumnaren Genotyp. Damit ist keiner der verfügbaren Co-Gen gekoppelten Marker sortenunabhängig und absolut mit Co gekoppelt. 92 ERGEBNISSE 93 Abbildung 3.25 Genotypisierung der Apfelsorte Topaz mittels verschiedener Marker Eine Auswahl Co-Gen gekoppelter Marker (Liebhard et al. 2002; Tian et al. 2005; Fernández-Fernández et al. 2006; Moriya et al. 2009; Moriya et al. 2012; Bai et al. 2012) sowie die selbst erstellten Marker wurden auf genomische DNA von Topaz getestet. Abgebildet ist eine Zusammenstellung der Gelbilder der PCRs. Alle Marker zeigen den heterozygoten (Co/-) Genotyp, obwohl Topaz eindeutig einen nicht kolumnaren Phänotyp besitzt. Als Vergleich dienen genomischen DNAs der Sorten P28 und A14. ERGEBNISSE 3.7.4 Transposon-basierende Marker Die Identifizierung des Transposons Gypsy-44 in der Region um 18,79 Mbp auf Chromosom 10 als der einzige Unterschied zwischen den Apfelsorten McIntosh und McIntosh Wijcik war die Basis für weitere Markeranalysen (Kapitel 3.5.2). Es wurden drei Primerpaare entworfen: 1. „Linker Rand“, das Primerpaar überspannt das linke Ende von Gypsy-44 und einen Teil der linken flankierenden DNA; 2. „Rechter Rand“, die beiden Primer überspannen das rechte Ende von Gypsy-44 sowie einen Teil der rechten flankierenden DNA; 3. „überspannend“, die Primer überspannen das komplette Transposon sowie einen Teil der rechten und linken flankierenden DNA (Abbildung 3.26). Abbildung 3.26 Gypsy-44-basierende Primer Die Abbildung zeigt schematisch die Lage der Primer für die Transposon-basierenden Marker sowie die erwarteten Größen der PCR-Produkte. Im linken Teil der Abbildung ist das kolumnare Chromosom dargestellt. Es sind die Positionen der drei erstellten Primerpaare eingezeichnet. Das Primerpaar „Linker Rand“ überspannt das linke Ende von Gypsy-44 und einen Teil der linken flankierenden DNA (rot). Die beiden Primer „Rechter Rand“ überspannen das rechte Ende von Gypsy-44 sowie einen Teil der rechten flankierenden DNA (blau). Die Primer „überspannend“ überspannen das komplette Transposon sowie einen Teil der rechten und linken flankierenden DNA (grün). Im rechten Teil der Abbildung ist das nicht kolumnare Chromosom mit der „leeren“ „target site“ (TS) dargestellt. Gypsy-44 ist nicht vorhanden. Mit dem Primerpaar „überspannend“ wird bei einer PCR lediglich die „leere“ „target site“ und ein Teil der rechten und linken flankierenden DNA amplifiziert. Als Template für die PCRs dienten genomische DNAs der nicht kolumnaren Apfelsorten McIntosh, A14 und Topaz, der heterozygot kolumnaren Sorten P28 und McIntosh Wijcik und der homozygot kolumnaren Sorte A73-19-93K (A73). Die gelelektrophoretische Auftrennung der PCR-Produkte ist in Abbildung 3.27 dargestellt. 94 ERGEBNISSE Abbildung 3.27 Gypsy-44-spezifische PCR auf genomische DNAs diverser Apfelsorten Mit Primern, die den linken (rot) und rechten (blau) Rand sowie das komplette Transposon bzw. die Integrationsstelle (grün) überspannen, wurden PCRs auf genomische DNAs kolumnarer (fett) und nicht kolumnarer Sorten durchgeführt. Die Abbildung zeigt die gelelektrophoretische Auftrennung der PCR-Produkte der Gypsy-44-spezifischen Marker. Als Molekulargewichtsmarker dienten die 50 bp und 100 bp Ladder. Die heterozygot und homozygot kolumnaren Apfelsorten zeigen ein PCR-Produkt in erwarteter Höhe für den linken und rechten Rand des Transposons. Dies beweist, dass das Transposon an der untersuchten Position vorhanden ist. Bei den nicht kolumnaren Apfelsorten tritt hingegen kein PCR-Produkt in entsprechender Höhe auf. Die Integrationsstelle-überspannende PCR zeigt für die heterozygot kolumnaren und nicht kolumnaren Sorten ein Produkt, welches die Anwesenheit der „leeren“ Integrationsstelle (ohne Transposon) anzeigt. Die homozygot kolumnare Sorte zeigt dabei kein Produkt. Ein mögliches PCR-Produkt eines homozygot kolumnaren Genotyps sowie des kolumnaren Chromosoms der heterozygot kolumnaren Sorten entsteht vermutlich aufgrund seiner enormen Größe (etwa 8,5 kb) unter den gewählten Amplifikationsbedingungen mit genomischer DNA als Template nicht. Verwendet man hingegen den entsprechenden BAC als Template, gelingt die Amplifikation des erwarteten DNA-Fragments. Neben den gezeigten Apfelsorten wurde das Primerpaar, welches den rechten Rand des Transposons überspannt, auf die nicht kolumnaren Apfelsorten Jonagold, Gala, Elswout und Pinova, 95 ERGEBNISSE sowie auf die kolumnaren Sorten Procats 1, Procats 4, Procats 11, Procats 13, Greencats, Kordonia, Pomforyou, Pomfital, Pomgold, A10-28 und HL 4 K getestet. In allen kolumnaren Apfelsorten tritt die erwartete PCR-Bande auf, wohingegen sie bei den nicht kolumnaren Sorten fehlt (Daten Doktorarbeit Romina Petersen, IMSB). Somit konnte ein molekularer Marker etabliert werden, der sortenunabhängig die Differenzierung zwischen kolumnarem und nicht kolumnarem Genotyp ermöglicht. 96 DISKUSSION 4 Diskussion Kolumnare Apfelbäume können aufgrund ihrer sehr kompakten Wuchsform erheblich dichter gepflanzt werden als normalwüchsige Bäume, was in einer Steigerung des Ertrags um bis zu 300 % pro Hektar resultiert (Jacob 2010). Das wirtschaftliche Interesse wird darüber hinaus dadurch geweckt, dass lediglich minimaler Aufwand für den Rückschnitt der Bäume betrieben werden muss und die Ernte mittels Vollerntemaschinen durchgeführt werden kann (Tobutt 1985). Allerdings weisen kolumnare Apfelbäume auch einige negative Eigenschaften wie schlechte Fruchtqualität und verminderte Lagerfähigkeit der Früchte, sowie eine hohe Anfälligkeit gegen Krankheiten wie beispielsweise Apfelschorf auf (Meulenbroek et al. 1998; P. Braun, pers. Kommunikation). Die Erzeugung von Apfelsorten mit kolumnarem Wachstum und hoher Fruchtqualität durch konventionelle Kreuzung gestaltet sich aufgrund des stark heterozygoten Charakters und der Selbstinkompatibilität des Apfels sowie der langen juvenilen Phase als besonders schwierig (Hemmat et al. 1994). Aus diesem Grund ist die Identifizierung und Charakterisierung der Co-Mutation für die Apfelzüchtung von großer Bedeutung. Allerdings ist die molekulare Ursache des Kolumnarwachstums weitgehend unerforscht. Die Motivation zu dieser Arbeit ist daher die Aufklärung der molekularen Natur der Co-Mutation. Das Ziel sollte klassisch über positionelles Klonieren in Kombination mit Next-Generation Sequencing erreicht werden. Als Ausgangsmaterial für die Konstruktion der BAC-Bibliotheken diente die heterozygot kolumnare Apfelsorte P28, da für diese in-vitro-Kulturen in ausreichender Menge und jederzeit zur Verfügung standen. Darüber hinaus war genügend Material aus einer Nachkommenschaft einer Kreuzung zwischen P28 und A14 vorhanden, was als Grundlage für die Feinkartierung der Co-Region und die Erstellung Co-Gen gekoppelter Marker diente. Die Apfelsorten McIntosh Wijcik und McIntosh waren darüber hinaus in Form genomischer Illumina Next-Generation Sequencing Reads verfügbar, um identifizierte Unterschiede zwischen dem kolumnaren und dem nicht kolumnaren Chromosom auf Zusammenhänge mit der Co-Mutation zu überprüfen. Zur weiteren Unterstützung der Ergebnisse diente eine Auswahl kolumnarer und nicht kolumnarer Apfelsorten. 4.1 Bestimmung der Co-Zielregion Für die molekulare Analyse der Co-Mutation ist eine möglichst genaue genomische Lokalisierung von entscheidender Bedeutung. Bereits 1997 lokalisierten Conner et al. die Co-Region auf Chromosom 10. Im Laufe der Jahre wurde die genomische Lage von Co durch 97 DISKUSSION immer neue und enger gekoppelte Marker verfeinert (Liebhard et al. 2002; Tian et al. 2005; Bai et al. 2012; Baldi et al. 2012; Moriya et al. 2012). Ein wichtiger Schritt bei der Identifizierung der Co-Region stellte die Veröffentlichung des Apfelgenoms im Jahr 2010 dar (Velasco et al. 2010). Die Berechnung der Co-Zielregion auf der Basis dieses Referenzgenoms diente in der vorliegenden Arbeit als erster Anhaltspunkt zur Identifizierung von Co. Im weiteren Verlauf konnte diese durch selbst erstellte Marker verifiziert und verfeinert werden. Allerdings war die stark begrenzte Nachkommenschaft von etwa 100 Nachkommen aus einer Kreuzung der Sorten P28 und A14 der limitierende Faktor bei der Feinkartierung der Zielregion. Dennoch konnte eine Grenze der Zielregion bei 18,228 Mbp auf Chromosom 10 mithilfe des Markers Ch03d11 bestimmt werden. Als experimentell gesicherte andere Grenze der Zielregion gilt der Marker Hi01a03 bei 19,911 Mbp. Die selbst erstellten Marker zeigten bei der verwendeten Nachkommenschaft alle eine 100 %-ige Kopplung mit Co, ebenso wie die Marker von Moriya et al. (2012) und Bai et al. (2012). Die Marker von Baldi et al. (2012) wurden nicht verwendet, da in dem entsprechenden Bereich eigene Marker zur Verfügung standen. In Abbildung 4.1 sind die Zielregionen von Baldi et al. (2012), Bai et al. (2012) und Moriya et al. (2012) sowie die selbst ermittelte Zielregion dargestellt. Abbildung 4.1 Co-Zielregion Die Abbildung zeigt die Zielregionen der Publikationen von Baldi et al. (2012), Bai et al. (2012) und Moriya et al. (2012) sowie die Lage der selbst festgelegten Zielregion. Zudem ist der erstellte Gesamtcontig eingezeichnet. Ausschlaggebend für die feinere Kartierung der Zielregion anderer Forschergruppen ist die Verfügbarkeit deutlich größerer Nachkommenschaften, wie etwa 1250 Nachkommen bei Baldi et al. (2012). Der erstellte Gesamtcontig, der die Grundlage für die Charakterisierung der Co-Region bildet, beinhaltet jedoch die komplette Region von Baldi et al. (2012) sowie den größten Teil der Zielregion von Moriya et al. (2012). Wagt man einen Vergleich zwischen den Grundlagen, auf denen die Zielregionen der genannten Forschergruppen 98 DISKUSSION erstellt wurden, so zeichnen sich Baldi et al. (2012) durch die größte analysierte Nachkommenschaft mit 1250 Nachkommen im Vergleich zu 528 (Bai et al. 2012) und 1000 Nachkommen (Moriya et al. 2012) aus. Baldi et al. (2012) wiesen darüber hinaus bei Verwendung des Markers C18470-25381, für den Bai et al. (2012) eine absolute Kopplung mit Co angeben, in der verwendeten Nachkommenschaft drei Rekombinante nach. Neben der Größe der Nachkommenschaft hat die Verwendung unterschiedlicher Apfelsorten großen Einfluss auf die exakte Lokalisierung der Co-Region. Moriya et al. (2009) wiesen, wie bereits Tian et al. (2005), abweichende Rekombinationsfrequenzen ausgewählter Marker in unterschiedlichen Populationen nach. In einer Population der Kreuzung Fuji und 8H-9-45 cosegregieren Ch03d11 und SCAR682 mit Co. In einer Population der Kreuzung Fuji und 5-12786 hingegen beträgt der genetische Abstand zu Co für Ch03d11 und für SCAR682 1,4 cM. Baldi et al. (2012) nutzten zwei Kreuzungen zwischen GD und McIntosh Wijcik, wohingegen Bai et al. (2012) vier Kreuzungen mit unterschiedlichen Kreuzungspartnern und Moriya et al. (2012) sogar 31 verschiedene Nachkommenschaften verwendeten. Eine Übertragung der Zielregionen auf andere Apfelsorten ist somit immer mit Vorsicht zu betrachten. Allerdings lässt sich zusammenfassend festhalten, dass der Bereich der selbst eingegrenzten Zielregion, der sowohl mit Baldi et al. (2012) und Moriya et al. (2012) übereinstimmt (670 – 830 kb im Gesamtcontig), als gesichert gelten und für weitere Analysen als Grundlage dienen kann. 4.2 Genomische Apfel-BAC-Bibliotheken Die Konstruktion genomischer DNA-BAC-Bibliotheken mit großen Integratmolekülen und einer hohen Anzahl rekombinanter Plasmide ist Voraussetzung für die positionelle Klonierung. Im Verlauf dieser Arbeit konnte die Herstellung der BAC-Bibliotheken durch einige Neuerungen erheblich verbessert werden. Zu Beginn der Arbeit wurde der Gewebeaufschluss der in-vitro-Kulturen mittels Homogenisator durchgeführt, wodurch die verwendete Menge an Ausgangsmaterial mit 1,5 g pro Durchgang stark begrenzt war und mehrere Durchläufe nötig waren, um ausreichend genomische DNA zu gewinnen. Durch die Verwendung eines Stabmixers für den Gewebeaufschluss konnte das pro Durchgang verwendete Ausgangsmaterial auf 30 g gesteigert werden. Dies führte zu einer enormen Zeitersparnis ohne Qualitätsverlust (Abbildung 3.2). Durch das Ansetzen mehrerer Restriktionsverdaus unterschiedlicher Restriktionsdauer und das anschließende Poolen dieser Ansätze, wurde das Problem minimiert, dass hochmolekulare DNA in Lösung 99 DISKUSSION inhomogen verteilt ist. Anfangs gelang aufgrund des sehr langen und aufwendigen Herstellungsprozesses nur etwa jede fünfte Bibliothek. Durch die Verwendung sogenannter „Mega“-Gele zur Größenfraktionierung, die eine etwa 25-fache Ladekapazität im Vergleich zu dem bisher verwendeten Gelsystem besitzen, konnte neben einer enormen Zeitersparnis auch die Effektivität der Konstruktion von BAC-Banken gesteigert werden. So gab es zum Ende dieser Arbeit keine Ausfälle bei der Konstruktion der Banken mehr. Zudem wurde durch ein Endfilling mittels radioaktiv markierter Nukleotide ein Test etabliert, mit dem die Konstruktion einer BAC-Bank bereits während des Herstellungsprozesses überprüft werden konnte. Die Qualität der Banken zu vergleichen, gestaltete sich jedoch schwierig, da für die Abschätzung der Integratgröße nur 12 Klone pro BAC-Bank aufgearbeitet wurden. Bei der BAC-Bank P28ivML1 aus der 32 der 37 BAC-Klone aus der Zielregion stammen, zeigte sich beispielsweise, dass die aufgrund der Restriktionsverdaus der Testklone angenommene durchschnittliche Integratgröße der Klone mit etwa 27 kb zu niedrig angesetzt war, da durch die Sequenzierung eine durchschnittliche Integratgröße von 40 kb bestimmt wurde (chimäre BAC-Klone ausgenommen). Dies könnte auch erklären, dass nach dem Screening der Bank P28ivL4 mit Sondenpool 1 nur drei positive Klone identifiziert wurden, bei der Bank P28ivML1 hingegen 25, obwohl die Gesamtintegratgrößen der beiden Banken lediglich um Faktor drei variieren. Neben der Integratgröße ist die Anzahl rekombinanter BAC-Klone ausschlaggebend für die Qualität einer BAC-Bibliothek. Durch die angesprochenen Neuerungen konnte die Anzahl der Klone von 26.000 auf 79.000 gesteigert werden (Tabelle 3.3). Zusammengefasst enthielten die vier erstellten genomischen Bibliotheken rund 150.000 rekombinante BAC- Klone mit etwa 26,5 kb durchschnittlicher Integratgröße, was einer statistischen Genomabdeckung von 5,4-fach entspricht. Unter Verwendung der Carbon-Clarke-Formel liegt die Wahrscheinlichkeit, in den erstellten Bibliotheken einen gesuchten einmaligen DNA-Abschnitt zu identifizieren, bei 99 %. Der Vergleich der selbst erstellten Banken mit anderen Apfel-BAC-Bibliotheken beispielsweise von Vinatzer et al. (1998) mit 36.864 Klonen und einer durchschnittlichen Integratgröße von 120 kb oder Xu et al. (2001) mit 31.584 Klonen und einer durchschnittlichen Größe von 125 kb zeigt, dass die Anzahl rekombinanter BAC-Klone in derselben Größenordnung liegt, die Integratgrößen jedoch in den selbst erstellen BAC-Bibliotheken erheblich kleiner sind. Die angesprochenen Arbeiten verwendeten die Methode nach Zhang et al. (1995), bei der die isolierten Nuklei in Agarose gegossen werden, um die DNA vor Scherkräften zu schützen. In diesen Agarose-„Plugs“ 100 DISKUSSION wird auch der anschließende Restriktionsverdau durchgeführt, ehe die Größenfraktionierungen mithilfe des „Pulsed-field gel electrophoresis“-Systems (Schwartz und Cantor 1984) folgen. Die Verwendung von Agarose-„Plugs“ und „Pulsed-field gel electrophoresis“-System zur Größenfraktionierung wurden im Rahmen einer Diplomarbeit (Otto 2008) ausführlich getestet. Es konnten jedoch keine zufriedenstellenden Resultate erzielt werden, sodass in der vorliegenden Arbeit von der Verwendung dieser Methode abgesehen wurde. 4.3 Erstellung einer Referenzsequenz der Co-Zielregion Die erstellten Apfel-BAC-Bibliotheken wurden mittels Koloniefilter-Hybridisierung analysiert, um rekombinante Plasmide aus der Zielregion zu identifizieren. Für das Screening wurden PCR-basierende Sonden erstellt (Anhang A2). Das Screenen der BAC- Bibliotheken führte zur Detektion von 61 Klonen mit den Sondenpools 1, 2 und 3. Von diesen 61 Klonen stammen 36 Klone von Chromosom 10, 13 Klone von Chromosom 5 und 12 von anderen Chromosomen. Der Grund, warum so viele Klone von Chromosom 5 stammen, liegt vermutlich darin, dass Chromosom 5 und Chromosom 10 eine große Anzahl paraloge Sequenzen enthalten, die durch eine genomweite Duplikation während der Evolution des Apfelgenoms entstanden sind (Abbildung 4.2 A). Im „Circle Plot“, der die Colinearität genomischer Bereiche des Chromosoms 10 mit den anderen Apfelchromosomen darstellt, lässt sich die enge Verwandtschaft der Chromosomen 5 und 10 deutlich erkennen (Abbildung 4.2 B). 101 DISKUSSION Abbildung 4.2 Evolution des Apfelgenoms A) zeigt einen phylogenetischen Stammbaum ausgewählter Landpflanzen mit als Kreise eingezeichneten genomweiten Duplikationen. Die genomweite Duplikation, aus der sich die enge Verwandtschaft zwischen Chromosom 5 und 10 begründet, ist in rot dargestellt, die genomweite Duplikation in der Evolution der Eudikotyledonen in gelb. Der Stammbaum wurde in Anlehnung an Proost et al. (2011) erstellt. B) stellt den Sequenzvergleich von Chromosom 10 des Apfels mit allen anderen Apfelchromosomen dar. Auffällig ist die große Übereinstimmung zwischen Chromosom 5 und Chromosom 10 infolge einer genomweiten Duplikation. Der „Circle Plot“ wurde mit der Plattform PLAZA erstellt (Proost et al. 2009). Die 12 nur scheinbar positiven BAC-Klone von anderen Chromosomen resultieren vermutlich aus den moderaten Hybridisierungsbedingungen (60 °C in 3 x SSC) der Koloniefilter-Hybridisierung. Eine weitere Ursache sind möglicherweise homologe Bereiche zwischen Chromosom 10 und anderen Apfelchromosomen durch eine ursprünglichere genomweite Duplikation, die in der Evolution der Eudikotyledonen stattgefunden hat, aber bereits sehr lange zurückliegt (Abbildung 4.2 A). Ein stringenteres Verfahren für das Screening von BAC-Bibliotheken ist das PCR-basierte Screening (Xu et al. 2001). Allerdings ist dieses Verfahren sehr kostenintensiv, da das rekombinante Plasmid jeder Kolonie vor dem Screening isoliert werden muss. Der Sondenpool 4 führte zu 51 vermeintlich positiven Klonen, wobei letztlich nur ein Klon auf Chromosom 10 in der Zielregion positioniert werden konnte. Ausschlaggebend dafür ist der leicht repetitive Charakter der verwendeten Sonden, der mittels „Pirotta“ Blot nachgewiesen wurde (Kapitel 3.3). Die repetitive Struktur der Sonden liegt in ihrer genomischen Herkunft begründet. Die Region, in der die Sonden aus Sondenpool 4 liegen (615 bis 665 kb im Gesamtcontig), enthält überwiegend transposable Elemente und nur ein Gen, welches in einem Retrotransposon lokalisiert ist 102 DISKUSSION (Abbildung 3.20). Dies veranschaulicht die Schwierigkeit, in dieser Region eine „single- copy“-Sonde zu erstellen. Die Randsequenzierung der Klone stellte ein adäquates Mittel zur endgültigen Lokalisierung der BAC-Klone dar (Tabelle 3.5). Die vollständige Sequenzierung erfolgte bei einigen Klonen mittels Shotgun-Sequenzierung (K25, H2, H4 und K4), bei der Mehrzahl jedoch mittels Illumina Next-Generation Sequencing. Während die Sequenzierung mittels Shotgun- bzw. Sangersequenzierung Sequenzen bis zu 1.000 bp Länge liefert, werden beim Illumina Next- Generation Sequencing Reads mit einer Länge von lediglich 101 bp generiert. Nach Aufbereitung der Rohdaten liegt die durchschnittliche Readlänge bei etwa 86 bp. Die erheblich kürzere Readlänge wird durch eine wesentlich höhere Abdeckung ausgeglichen. Allerdings bleiben repetitive Sequenzen der limitierende Faktor bei einer Assemblierung. Ist ein repetitives Element länger als die verfügbare Sequenzlänge, führt dies zu Lücken in der Assemblierung (Schatz et al. 2010). Die Unterschiede zwischen den verschiedenen Sequenziermethoden hinsichtlich Länge und Zahl der erhaltenen Sequenzen erfordern die Verwendung unterschiedlicher Assemblierungsstrategien. Während das Programm SeqMan™ auf der „Overlap-Layout-Consensus“-Strategie (OLC) basiert, bedient sich CLC des „de Bruijn“-Graphen (DBG) (Kumar und Blaxter 2010). Die OLC-Strategie beruht stark vereinfacht dargestellt auf dem paarweisen Vergleich der Sequenzen zur Identifizierung von Überlappungen und letztlich zur Erstellung einer Consensus-Sequenz (Myers 1995). Sie eignet sich besonders für die Assemblierung von Sequenzen die mit dem Sangerverfahren erstellt wurden. Wichtige Parameter bei dieser Strategie sind die Festlegung der minimalen Länge einer Überlappung sowie deren minimale Sequenzidentität (Miller et al. 2010). Bei Verwendung eines DBGs werden die Sequenzen hingegen in kurze Fragmente definierter Länge, sogenannte k-mers, zerlegt (de Bruijn und Erdos 1946). Dies ermöglicht die Bearbeitung großer Datensätze, wie sie bei Illumina-Sequenzierungen der Fall sind, da nicht jede Sequenz gespeichert werden muss, sondern lediglich die unterschiedlichen k-mers und deren Anzahl. Bei der Assemblierung werden k-mers miteinander verknüpft, die eine Überlappung der Länge k-1 besitzen, und so zu Consensus-Sequenzen zusammengefügt. Diese Methode ist sehr sensitiv gegenüber repetitiven Strukturen, die länger als die verwendete k-mer Länge sind, und Sequenzierfehlern (Miller et al. 2010). Durch eine Verfeinerung der Algorithmen werden diese Probleme jedoch minimiert (Pevzner et al. 2004). Darüber hinaus wird zur Verbesserung der Assemblierung in repetitiven Bereichen verstärkt die Information der „paired end“-Sequenzierung für die Assemblierung genutzt. 103 DISKUSSION Die Verwendung der „paired end“-Sequenzierung ermöglicht es, dass man zwei zueinander gehörige Reads eines DNA-Fragmentes mit bekannter Distanz erhält, was zum Überspannen von repetitiven Bereichen führen kann, insbesondere bei der Verwendung von „mate pair“- Bibliotheken (Chaisson et al. 2009). Die Assemblierung der BAC-Klone, die mittels shotgun-Sequenzierung sequenziert wurden, erfolgte problemlos mithilfe des Programms SeqMan™. Allerdings ist diese Sequenziermethode im Vergleich zum Illumina Next-Generation Sequencing sehr kosten- und zeitintensiv (Schatz et al. 2010), weswegen die Mehrzahl der Klone Illumina sequenziert wurden. Wie aber bereits geschildert stellt die Assemblierung der Illumina- Reads eine Herausforderung dar. Letztlich war die Kombination der beiden Assemblierungsstrategien in Form von OLC und DBG die Methode der Wahl. Dazu wurden zunächst de novo-Assemblierungen der Illumina-Reads mittels DBG mit der CLC Genomics Workbench und der Assembly Cell durchgeführt. Die Verwendung variierender k-mer- Längen ist ein wichtiger Schritt bei der Assemblierung von Next-Generation Sequencing- Datensätzen (Surget-Groba und Montoya-Burgos 2010). Die Wahl der optimalen k-mer Länge hängt von mehreren Faktoren ab, etwa der Gesamtabdeckung, der Fehlerrate der Reads und der Komplexität des zu assemblierenden DNA-Moleküls (Simpson et al. 2009). Da die optimale k-mer Länge schwer vorherzusagen ist und von BAC-Klon zu BAC-Klon variiert, wurden für jeden BAC-Klon Assemblierungen mit verschiedenen k-mer Längen durchgeführt. Die entstehenden Contigs wurden anschließend mittels OLC in SeqMan™ erneut assembliert. Von entscheidender Bedeutung für die Auswahl des korrekten Contigs war das Vorhandensein der Randsequenzen, der Vektorsequenz und des Ringschlusses. Die BAC-Sequenzen wurden darüber hinaus durch ein Mapping der Illumina-Reads überprüft. Homopolymer-Runs und Bereiche mit geringem GC-Gehalt zeigen eine geringe Abdeckung in den Mappings (Minoche et al. 2011). Diese Bereiche wurden daher mittels Sanger- Sequenzierung überprüft. Möglicherweise kommen diese Schwankungen in der Abdeckung durch den Amplifikationsschritt in der Herstellung der Illumina-Bibliotheken zustande (Aird et al. 2011). Mit der Erstellung von Restriktionskartierungen konnten die BAC-Sequenzen abschließend verifiziert werden (Abbildung 3.5). Eine Besonderheit bei den Restriktionsverdaus war das vereinzelte Auftreten nicht geschnittener XbaI-Schnittstellen, trotz intakter Erkennungssequenz. Die Ursache dafür liegt in der Verwendung eines dam+ E.coli-Stammes (DH10B) für die Konstruktion einer BAC-Bibliothek in Kombination mit der Verwendung 104 DISKUSSION eines dam-sensitiven Restriktionsenzyms (XbaI) für die Restriktionskartierungen. Die Dam- Methylase methyliert in E.coli die N6-Position des Adenins in der Erkennungssequenz „GATC“ (Hattman et al. 1978). Die Restriktionsendunuklease XbaI besitzt die Erkennungssequenz „TCTAGA“. Statistisch betrachtet folgt in 1/16 der Fälle der Erkennungssequenz „TCTAGA“ die Basenfolge „TC“, was zur Bildung einer Dam- Methylierungsstelle führt („TCTAGATC“). Die daraus resultierende Methylierung der Restriktionsschnittstelle verhindert die Spaltung der DNA durch das Enzym XbaI (Luo et al. 2003). An allen untersuchten Positionen, an denen eine XbaI-Schnittstelle nicht geschnitten wurde, liegt eine Dam-Methylierungsstelle vor. Für Restriktionsverdaus mit ClaI konnte selbiges Phänomen festgestellt werden. Das dam-sensitive Enzym besitzt die Erkennungssequenz „ATCGAT“, wodurch eine Methylierung sogar in 1/4 der Fälle auftritt. Die zweite Besonderheit bei den Restriktionsverdaus war die deutliche gelelektrophoretische Trennung zweier DNA-Moleküle, deren Molekülgröße nur um 6 bp variierte (Abbildung 3.5). PCR-Analysen und anschließende Sequenzierungen zeigten, dass die Sequenzen korrekt assembliert wurden, die 1320 bp-Bande jedoch eine deutlich langsamere Wanderungsgeschwindigkeit aufwies als die Größe vermuten lassen würde. Eine mögliche Erklärung für dieses Phänomen ist eine Krümmung der DNA, die Einfluss auf die gelelektrophoretische Auftrennung hat (Hagerman 1984). Die Krümmung wird zum Beispiel durch Homopolymere von Adenin bzw. Thymin, die in bestimmten Wiederholungen auftreten, verursacht (Koo et al. 1986). Trotz der weit verbreiteten Meinung, dass dieses Phänomen nur bei Polyacrylamid-Gelen auftritt (u.a. Marini et al. 1982), konnten Calladine et al. (1991) zeigen, dass dies auch in Agarose-Gelen zu beobachten ist und die entsprechenden DNA-Moleküle nur etwa 92 % ihrer Wanderungsgeschwindigkeit aufweisen. Ein Problem bei Klonierungsexperimenten besteht in dem Auftreten chimärer BAC-Klone, die durch Ligation zweier DNA-Moleküle unterschiedlicher chromosomaler Herkunft in ein Vektor-Molekül entstehen, da somit eine Verknüpfung von Sequenzen stattfindet, die auf genomischer Ebene nicht existiert. Nach erfolgreicher Assemblierung der Sequenzen der BAC-Klone und Verifizierung der Sequenzen sollte daher bei chimären BAC-Klonen der Anteil extrahiert werden, der aus der Zielregion stammt. In der BAC-Bibliothek P28ivML1 konnten von den 32 Klonen aus der Zielregion fünf chimäre Klone identifiziert werden (Tabelle 3.5). Dies entspricht einem prozentualen Anteil von 13,5 % der BAC-Klone und liegt damit über dem in der Regel beobachteten Anteil chimärer Klone von 4 bis 11 % (Volik et al. 105 DISKUSSION 2003). Mögliche Ursache für deren Entstehung ist eine hohe DNA-Konzentration bei der Ligation (Osoegawa et al. 1998). Die detektierten Klone enthalten zwei etwa gleich große DNA-Moleküle unterschiedlichen chromosomalen Ursprungs (Tabelle 3.9). Meist beinhalten chimäre Klone jedoch ein sehr großes und ein sehr kleines DNA-Fragment (Osoegawa et al. 2000). Diese Beobachtung bezieht sich jedoch auf BAC-Bibliotheken mit durchschnittlichen Integratgrößen von 130 bis 200 kb. Chimäre BACs aus etwa gleich großen DNA-Molekülen würden sich aufgrund der enormen Größe mit erheblich schlechterer Effektivität transformieren lassen, womit ihr Auftreten sehr selten ist (Sheng et al. 1995). Im Gegensatz dazu besitzen die hier erstellten BAC-Bibliotheken im Durchschnitt eine Integratgröße von lediglich 30 kb, sodass selbst ein chimärer BAC mit ungefähr 60 kb Integrat kaum schlechter transformierbar wäre. Sheng et al. (1995) verzeichneten eine erhebliche Abnahme der Transformationseffizienz erst bei Plasmiden über 80 kb. Dies könnte somit eine Erklärung für den höheren Anteil an chimären BAC-Klonen in der untersuchten BAC-Bibliothek sein. Allerdings standen mit der BLAST-Suche gegen das GD-Genom und der Verfügbarkeit der „mate pair“-Datensätze für ein Mapping (Abbildung 3.7) zwei Methoden zur Verfügung, um chimäre BAC-Klone schnell zu identifizieren. Aufwendiger war die Untersuchung des Klons 2I4, bei dem die BLAST-Suche und das Mapping der „mate-pair“-Datensätze widersprüchliche Ergebnisse lieferten. Allerdings konnte durch „long range“ PCR, Southern Blot-Analysen und inverse PCR zweifelsfrei nachgewiesen werden, dass es sich bei 2I4 nicht um einen chimären BAC-Klon handelt, sondern der BLAST-Treffer in einem GD-Contig liegt, der fälschlicherweise auf Chromosom 4 anstelle von Chromosom 10 positioniert wurde. Insgesamt wurden drei Contigs von Chromosom 4 und ein Contig von Chromosom 9 letztlich auf Chromosom 10 neu kartiert, sowie 21 Contigs identifiziert, die keine Übereinstimmung zu Sequenzen aus der untersuchten Region aufweisen und somit vermutlich von anderen Chromosomen stammen. Ursache dafür könnten mögliche Unterschiede zwischen der untersuchten Sorte P28 und GD sein. Wahrscheinlicher ist jedoch, dass es sich um Fehler bei der Assemblierung und Annotation des Apfelgenoms handelt, was bei einem sogenannten „draft genome“, also eine Art Entwurf des Genoms, nicht ausgeschlossen ist. Aufgrund der erstellten Co-Gen gekoppelten Marker konnten alle BAC-Sequenzen dem kolumnaren und nicht kolumnaren Chromosom zugeordnet und Chromosomen-spezifisch zu Metacontigs zusammengefügt werden (Abbildung 3.10). Die Metacontigs und „long range“ PCR-Produkte wurden zu einem Gesamtcontig von 848.024 bp Länge 106 DISKUSSION zusammengefasst. Die Metacontigs und der Gesamtcontig wurden anhand genomischer Illumina „mate pair“-Datensätzen der Apfelsorte P28 auf Richtigkeit überprüft. Die Mappings der „mate pair“-Reads gegen den Gesamtcontig zeigten im Besonderen in den Datensätzen der großen Fraktion (7 bis 8 kb) mit 50 bis 72 % einen großen Anteil an Duplikaten (Tabelle 3.8). Grund für den hohen Anteil ist vermutlich der Amplifikationsschritt in Form einer Anreicherungs-PCR bei der Herstellung der „mate pair“- Bibliothek. Die hohe Zahl an Duplikaten scheint bei „mate pair“-Bibliotheken nicht außergewöhnlich zu sein. Bei der Sequenzierung des Pandagenoms liegt der durchschnittliche Anteil an Duplikaten für Banken mit 5 kb Fragmentgröße bei 39 %, bei Banken mit 10 kb Fragmentgröße sogar bei 77 % (Li et al. 2010). Durch die Funktion „Remove Duplicate Reads“ der CLC Genomics Workbench konnten die Duplikate jedoch problemlos entfernt werden, sodass die Verfügbarkeit der „mate pair“-Reads für Mappings eine einfache Möglichkeit zur Überprüfung des Gesamtcontigs darstellte. Lediglich eine Position, zwischen 240 und 250 kb im Gesamtcontig, zeigt eine Lücke (Abbildung 3.11). Es handelt sich dabei um den Übergang eines Metacontigs des kolumnaren Chromosoms (3c) zu einem „long range“ PCR-Produkt (LR_Mc_3c_3nc), welches aufgrund der hohen Übereinstimmung zu dem dort annotierten GD Contig vermutlich das nicht kolumnare Chromosom widerspiegelt. Größere Unterschiede zwischen den beiden Chromosomen könnten ausschlaggebend dafür sein, dass ein Mapping mit maximaler Stringenz zu keiner Überspannung dieser Position führt. Von einer umfangreichen Analyse dieser Region wurde abgesehen, da die betreffende Stelle mit einer Entfernung von fast 500 kb zur Integrationsstelle von Gypsy-44 höchstwahrscheinlich in keinem Zusammenhang mit der Co-Mutation steht. Obwohl die genomische Situation an dieser einen Position nicht abschließend geklärt werden konnte, wurde der Gesamtcontig als zusammenhängende Consensus-Sequenz für weitere Analysen verwendet. 4.4 Analyse der Co-Zielregion Die Referenz der Co-Zielregion hat eine Länge von 848.024 bp. Den größten Anteil stellen transposable Elemente mit rund 40 %, was in guter Korrelation mit ihrem Anteil von rund 42,4 % des Gesamtgenoms des Apfels steht (Velasco et al. 2010). Betrachtet man die transposablen Elemente in Bezug auf die Klassifizierung nach Wicker et al. (2007), lassen sie sich zunächst grob in die Klassen Retrotransposons und DNA- Transposons unterteilen. Retrotransposons machen mit 89,5 % den Hauptanteil 107 DISKUSSION transposabler Elemente des Gesamtcontigs aus, was ebenfalls in guter Übereinstimmung mit ihrem Anteil von 88,7 % an transposablen Elementen im Apfelgenom steht (Velasco et al. 2010). Aufgrund des hohen genomischen Anteils verwundert es nicht, dass die Größe eines Genoms mit der Gesamtmasse an Retrotransposons und deren Anzahl an verschiedenen Familien korreliert (Kumar und Bennetzen 1999). Das 12 Mbp große Genom von Saccharomyces cerevisiae besitzt nur fünf verschiedene Familien von LTR- Retrotransposons, die etwa 3 % des Genoms ausmachen (Kim et al. 1998). Das Genom von Arabidopsis thaliana (125 Mbp) besteht zu 10 % aus Retrotransposons mit etwa 100 Familien (TAGI 2000). Zea mays mit einer Genomgröße von 2,3 GBp setzt sich zu rund 70 % aus Retrotransposons zusammen, die mehreren 100 Familien angehören (SanMiguel und Bennetzen 1998). Retrotransposons lassen sich in die Unterklassen LTR- und Non-LTR- Retrotransposons unterteilen. Die Non-LTR-Retrotransposons machen nur etwa 15,3 % der Retrotransposons im Gesamtcontig aus, wobei davon 14,5 % auf LINEs und nur 0,82 % auf SINEs entfallen. Den Hauptanteil der Retrotransposons bilden die LTR-Retrotransposons mit 74,2 % in Form der Superfamilien Gypsy (43,3 %) und Copia (23,8 %). Während der prozentuale Anteil an LINEs sehr gut mit dem Anteil am Gesamtgenom von 15,3 % übereinstimmt, ist die Superfamile Gypsy im Gesamtcontig etwas unter- (59,5 % in GD) Copia hingegen überrepräsentiert (12,9 % in GD). Für SINEs steht kein Vergleichswert zur Verfügung. Die Unterschiede der prozentualen Anteile von Gypsy und Copia hängen vermutlich damit zusammen, dass Retrotransposons nicht gleichmäßig über das komplette Genom verteilt sind, sondern oftmals geclustert auftreten (Kumar und Bennetzen 1999). Neben transposablen Elementen konnten im Gesamtcontig insgesamt 83 Gene annotiert werden. Von diesen 83 Genen beruhen 53 auf Annotationen im GD-Genom, wobei 15 durch Transkriptomdaten aus dem Sprossapikalmeristem verifiziert wurden. Bei 27 Genen wurde die Annotation geändert und weitere 3 Gene wurden neu annotiert. Eine repräsentative Anreicherung von Genen ähnlicher Funktion in der Co-Zielregion wurde mittels Blast2GO (Conesa und Götz 2008) überprüft, konnte aber nicht festgestellt werden. Allerdings befinden sich durchaus Gene oder Gengruppen in dieser Region, die potenzielle Kandidaten für Co sind, wie beispielsweise Transkriptionsfaktoren, Methyltransferasen/Demethylasen, Spleißfaktoren, Gene, die mit Phytohormonen in Verbindung stehen, sowie Kinasen/ Phosphatasen. Die Gene wurden auf Unterschiede zwischen dem kolumnaren und nicht kolumnaren Chromosom untersucht. Die Analysen stützen sich auf genomische und transkriptomische Illumina-Datensätze in Kombination mit PCRs der Apfelsorten McIntosh 108 DISKUSSION und McIntosh Wijcik, sowie P28 und A14 (Doktorarbeit Romina Petersen, IMSB). In den potenziellen Kandidatengenen für Co in dieser Region konnten jedoch keine kolumnar- spezifischen Unterschiede festgestellt werden, wodurch eine direkte Wirkung der überprüften Gene als Co-Gen ausgeschlossen werden konnte. Die Analyse beschränkte sich auf die kodierenden Bereiche der Gene, sodass mögliche regulatorische Sequenzen nicht überprüft wurden. Zur Identifizierung der Co-Mutation waren neben Unterschieden in den Genen strukturelle Variationen zwischen dem kolumnaren und nicht kolumnaren Chromosom von besonderem Interesse. Dies wurde durch Sequenzvergleiche zwischen den chromosomen-spezifischen Metacontigs der heterozygot kolumnaren Apfelsorte P28 und durch Sequenzvergleiche zwischen dem Gesamtcontig von P28 und dem GD-Genom umgesetzt und auf diese Weise 21 größere Indels (> 100 bp) identifiziert (Abbildung 3.12 bis 3.14). Um zu überprüfen, ob diese Unterschiede tatsächlich kolumnar-spezifisch sind und nicht der stark heterozygote Charakter des Apfelgenoms oder der Vergleich unterschiedlicher Apfelsorten (P28 gegen GD) die Ursachen dieser Unterschiede sind, wurden genomische Illumina-Reads der Apfelsorten McIntosh und McIntosh Wijcik für Mappings verwendet (Tabelle 3.11). Damit konnte eine Assoziation von 20 Indels mit der Co-Mutation ausgeschlossen werden. Lediglich die 8,2 kb große Insertion (Indel 19), die eine Kopie des Gypsy-44 Retrotransposons darstellt, unterscheidet den kolumnaren vom nicht kolumnaren Haplotyp (Position 710.0063 bis 718.262 im Gesamtcontig). 4.5 Identifizierung der Co-Mutation Die Integration des Gypsy-44 Retrotransposons konnte als einziger Unterschied zwischen dem kolumnaren und dem nicht kolumnaren Chromosom in P28 festgestellt und anhand der genomischen Illumina-Daten von McIntosh Wijcik bestätigt werden. Um die Verbindung zwischen der Insertion von Gypsy-44 und dem kolumnaren Phänotyp zu überprüfen, wurden genomische PCRs, die dessen Integrationsstellen an Position 18,79 auf Chromosom 10 überspannen, durchgeführt (Abbildung 3.27). Jede bisher auf diese Weise getestete DNA aus einer kolumnaren Apfelsorte erzeugt die PCR-Produkte, die für den rechten und linken Rand des Retrotransposons charakteristisch sind. Damit ist die Anwesenheit von Gypsy-44 an dieser Position 100 % korreliert mit dem kolumnaren Phänotyp. Bei jeder normalwüchsigen Apfelsorte fehlen hingegen diese PCR-Produkte. Nur das Amplifikat der „leeren“ „target site“ in der Transposon-überspannenden PCR wird erzeugt. Ein besonders 109 DISKUSSION aufschlussreicher Fall ist die normalwüchsige Sorte Topaz. Hier zeigen alle nicht auf dem Retrotransposon basierenden Markertests den Haplotyp des kolumnaren Genotyps (Abbildung 3.25). Die Transposon-basierenden Marker, die die Integrationsstellen von Gypsy-44 überspannen, sind hingegen die ersten und einzigen Marker, die für die Apfelsorte Topaz nicht den kolumnaren, sondern den korrekten nicht kolumnaren Genotyp zeigen. Die Untersuchung der Apfelsorten McIntosh und McIntosh Wijcik, die sich lediglich in der Co-Mutation unterscheiden, bestätigen die Hypothese, dass die Insertion von Gypsy-44 die entscheidende Mutation ist, die zum kolumnaren Phänotyp führt. Die selbst erstellten Indel-basierenden Marker zeigen in PCRs bei beiden Sorten dasselbe Bandenmuster (Tabelle 3.14), wohingegen bei Verwendung der Transposon-basierenden Marker ein unterschiedliches Bandenmuster auftritt. Die Sortenunabhängigkeit der Transposon-basierenden Marker – insbesondere im Hinblick auf die Sorte Topaz – sowie das unterschiedliche Bandenmuster zwischen McIntosh und McIntosh Wijcik beweisen, dass es sich im Gegensatz zu allen bisher erstellten Markern bei den Transposon-basierenden Markern nicht nur um Unterschiede zwischen dem kolumnaren und dem nicht kolumnaren Chromosom handelt, sondern um die Co-Mutation selbst. Eine genauere Untersuchung der Integrationsstelle von Gypsy-44 zeigt, dass sie sich in einem weiteren LTR-Retrotransposon (Gypsy-33) befindet (Abbildung 3.15). Die Tatsache, dass Retrotransposons in andere Retrotransposons integrieren, ist keine Seltenheit. Im Gesamtcontig konnten insgesamt neun solcher Ereignisse beobachtet werden, wobei in fünf Fällen nur noch ein solo-LTR Hinweise auf die Integration eines Retrotransposons liefert. Zudem wurde dieses Phänomen im Mais am Beispiel einer 280 kb Region, die das Adh1-F Gen enthält, beschrieben, in der zehn von 20 Retrotransposons in anderen Retrotransposons liegen (SanMiguel et al. 1996). Darüber hinaus findet man beim Apfel eine negative Korrelation zwischen Gen- und Retrotransposondichte (Troggio et al. 2012). Bereiche, in denen eine hohe Dichte an Genen vorliegt, enthalten wenige Retrotranspons und umgekehrt, wie es in den Abbildungen 3.19 und 3.20 deutlich zu erkennen ist. Das gleiche Phänomen tritt auch bei anderen Pflanzen auf, zum Beispiel bei der Hirse (Paterson et al. 2009). Zurückzuführen ist dies vermutlich auf die Tatsache, dass die Integration vor allem von LTR-Retrotransposons in Gene oder Genbereiche aufgrund ihrer Größe von 2000 bp bis 18.000 bp fatale Auswirkung auf die entsprechenden Gene und somit für die Wirtspflanze selbst hätte (Vitte und Panaud 2005; Bennetzen 2000). 110 DISKUSSION Die Sequenzidentität zwischen den beiden LTRs eines Retrotransposons lässt Rückschlüsse über den Zeitpunkt der Integration zu, da die LTRs bei der Integration identisch sind, im Laufe der Zeit jedoch durch Substitution einzelner Basen immer mehr voneinander abweichen (SanMiguel et al. 1998). Allerdings wird zur Berechnung der Zeitspanne die Substitutionsrate benötigt, die jedoch von Spezies zu Spezies unterschiedlich und für den Apfel nicht verfügbar ist. Bei Gräsern liegt sie bei 6,5×10-9 Substitutionen pro synonyme Stelle pro Jahr (Gaut et al. 1996). Auch ohne Berechnung des ungefähren Zeitpunktes der Integration fällt auf, dass die Sequenzidentität der LTRs bei verschachtelten Retrotransposons von innen nach außen abnimmt und damit das innere transposable Element in das außenliegende gesprungen ist. Im Fall von Gypsy-44 und Gypsy-33 betragen die Sequenzübereinstimmungen 94,6 % für das außenliegende Gypsy-33 und 100 % für das in Gypsy-33 integrierte Retrotransposon Gypsy-44. Die identischen LTRs von Gypsy-44 lassen den Schluss zu, dass die Integration erst kürzlich stattgefunden haben kann, was gut damit übereinstimmt, dass ein Auftreten der Co-Mutation erstmalig vor rund 50 Jahren beschrieben wurde. Wolters et al. (2013) wiesen parallel zu der vorliegenden Arbeit eine 1956 bp große Insertion bei McIntosh Wijcik als einzigen Unterschied in der Co-Zielregion von Baldi et al. (2012) im Vergleich zu McIntosh auf Grundlage von BAC-Banken der beiden Apfelsorten nach. Bei der Insertion, deren Position im Apfelgenom identisch mit dem in der vorliegenden Arbeit beschriebenen Integrationsort von Gypsy-44 ist, handelt es sich höchstwahrscheinlich um einen solo-LTR des Gypsy-44 Retrotransposons. Es sind flankierende „target sites“ vorhanden und diese identisch, sodass von einer Rekombination zwischen den LTRs einer Transposon-Kopie auszugehen ist. Ob die Rekombination jedoch tatsächlich im Genom von McIntosh Wijcik oder lediglich im untersuchten BAC während des Klonierungsprozesses stattgefunden hat bleibt offen. Damit bleibt zudem die Frage ungeklärt, ob die komplette Kopie von Gypsy-44 für den kolumnaren Phänotyp verantwortlich ist oder ob letztlich der solo-LTR an dieser Position ausreicht. Als gesichert gelten kann jedoch, dass in der Apfelsorte P28 an der untersuchten Position eine vollständige Kopie von Gypsy-44 vorhanden ist. Das Auftreten einer Knospen- bzw. Sprossmutation, wie im Fall von McIntosh und McIntosh Wijcik, die durch eine Insertion eines Retrotransposons zur Entwicklung einer neuen Sorte führt, ist kein Einzelfall. So entstanden neue Apfelsorten aus Knospenmutationen der Sorten Gala und Braeburn durch Insertion von Retrotransposons (Venturi et al. 2006). 111 DISKUSSION Darüber hinaus sind Sprossmutationen, oft durch Retrotransposons ausgelöst, entscheidend für die Sortenbildung bei Zitrusfrüchten (Asíns et al. 1999). Der Zusammenhang zwischen der Integration von Gypsy-44 und der Ausprägung des kolumnaren Phänotyps ist jedoch schwierig zu ermitteln, da die möglichen Wirkmechanismen von Retrotransposons äußerst vielfältig sind (Lisch 2013). In den Apfelsorten Rae Ime, Spencer Seedless und Wellington Bloomless erzeugt die Integration eines LTR-Retrotransposons in ein Intron des MdPI-Gens eine Nullmutation des Gens, was zur Bildung kernloser Früchte führt (Yao et al. 2001). Ein weiteres Beispiel wurde beim Wein beschrieben; dort führt die Integration eines Retrotransposons in den Promotorbereich des Gens Vvmyb1A, welches die Anthocyanin-Biosynthese reguliert, zu einer „loss of function“- Mutation, was sich phänotypisch in der Ausbildung weißer Beeren zeigt (Kobayashi et al. 2004). An Position 719.006 bis 719.299 und damit direkt neben der Integrationstelle von Gypsy-44 liegt das Gen für das Protein MDP0000766466. Es handelt sich aber vermutlich um das gag- homologe Gen des Gypsy-33 Retrotransposons, da es ein typisches Cys/His-Finger Motiv enthält (Otto et al. 2013). Ansonsten liegen keine weiteren Gene in unmittelbarer Nähe. Damit kann die Inaktivierung von Genen durch Erzeugung einer Nullmutation durch die Integration von Gypsy-44 in Gene oder deren unmittelbaren Promotorbereiche als sehr unwahrscheinlich angesehen werden. Möglicherweise hat das Transposon Einfluss auf weiter entfernt liegende Gene, beispielsweise durch die Insertion regulatorischer Elemente. Die Enhancer-Aktivität des Retrotransposons Hopscotch, welches im Mais rund 60 kb „upstream“ des teosinte branched 1 (tb1)-Locus integrierte, führt zu einer Überexpression von tb1 (Studer et al. 2011). Tb1 ist ein Transkriptionsfaktor, der die Ausbildung von Verzweigungen unterdrückt. Dies führt zu einer starken Verringerung der Seitentriebe im Mais im Vergleich zu der Vorläuferspezies Teosinte (Doebley et al. 2006). Betrachtet man die von der Integrationsstelle weiter entfernt liegenden Gene, befinden sich dort einige ursprüngliche Kandidaten für das Co-Gen, die in Zusammenhang mit der Entwicklung von Pflanzen stehen (Baldi et al. 2012). Es handelt sich dabei um Transkriptionsfaktoren der Familien „APETALA2/ethylene response factor“ (AP2/ERF), „basic helix-loop-helix“ (bHLH) und „No Apical Meristem“ (NAM). Drei in dieser Region annotierte Proteine (MDP0000855671, MDP0000286915 und MDP0000187369) zeigen signifikante Übereinstimmungen mit ERF-Transkriptionsfaktoren. Mitglieder der Familie AP2/ERF spielen Schlüsselrollen sowohl in der Entwicklung von Pflanzen, wie auch in der Reaktion 112 DISKUSSION der Pflanzen auf Stress (Yu et al. 2012). Das Protein MDP0000139773 liegt im Bereich um 800 kb im Gesamtcontig und ist laut InterPro-Domänensuche vermutlich ein NAM- Transkriptionsfaktor. Diese Proteine sind unter anderem an der Entwicklung des Sprossapikalmeristems beteiligt (Souer et al. 1996). An Position 817 kb im Gesamtcontig und damit etwa 100 kb von Gypsy-44 entfernt, befindet sich das Gen für das Protein MDP0000934866-like, ein bHLH-Transkriptionsfaktor. Die Funktion dieser Proteine ist sehr vielfältig und reicht von der Zell- und Gewebsentwicklung bis hin zu Stoffwechselprozessen (Heim et al. 2003). MDP0000934866-like ist das einzige der genannten für Transkriptionsfaktoren kodierenden Gene, für das eine Expression in den Transkriptomdaten des Sprossapikalmeristems der Sorte P28 nachgewiesen wurde (Tabelle 3.12). Weitere Gene in diesem Bereich sind die von Romina Petersen neu identifizierten Gene, die im GD-Genom nicht annotiert sind. Es handelt sich dabei um At1g08530-like, dessen Funktion unbekannt ist, um Downy Mildew Resistant 6-like, einem Regulator in der Abwehrreaktion von Pflanzen (Van Damme et al. 2005; 2008) und Auxin-induced protein 5NG4-like, das eine Funktion in der Wurzelbildung besitzt (Busov et al. 2004). Downy Mildew Resitant 6-like zeigt in Knospen eine signifikante Überexpression in McIntosh Wijcik im Vergleich zu McIntosh (Wolters et al. 2013). Welchen Einfluss die Integration von Gypsy- 44 allerdings tatsächlich auf die dort lokalisierten Gene hat, lässt sich nicht abschließend klären. Dazu wären weitere Experimente in Form einer Überexpression der Gene in nicht kolumnaren Apfelbäumen oder ein Ausschalten der Gene in kolumnaren Apfelbäumen erforderlich. Neben der Wirkung als Enhancer wäre auch ein gegenteiliger Effekt verursacht durch Gypsy-44 als Insulator denkbar. Ein Insulator verhindert die Wechselwirkungen zwischen Enhancer und Promotor eines Gens (Bell und Felsenfeld 1999). Die Wirkung eines Gypsy Transposons als Insulator wurde beispielsweise in Drosophila beschrieben (Gause et al. 2001). Darüber hinaus wurde in Tabakzellen und in Arabidopsis thaliana nachgewiesen, dass DNA-Fragmente durch die Integration in den Bereich zwischen Enhancer und Promotor als Insulatoren in Pflanzen fungieren können (Nagaya et al. 2001; Hily et al. 2009). Durch die Integration eines transposablen Elementes können neben regulatorischen Elementen auch die für die Transposition benötigten Gene durch zusätzliche Funktion Einfluss auf den Organismus haben (Muehlbauer et al. 2006). Das Retrotransposon Gypsy- 44 besitzt zwar einen transkribierten ORF von ungefähr 600 bp, allerdings konnten weder BLAST- noch Domänen-Suchen Aufschluss über die Funktion eines potenziellen Genproduktes geben. Damit besitzt Gypsy-44 nicht die für die Transposition typischen ORFs 113 DISKUSSION für GAG und Pol. Es stellt sich jedoch die Frage, wie Gypsy-44 zur Transposition befähigt ist, obwohl es offensichtlich nicht autonom ist. Möglicherweise verhält es sich ähnlich wie bei dem Retrotransposon Dasheng im Reis. Bei Dasheng wurde ebenfalls eine kürzliche Transposition festgestellt und das, obwohl es wie Gypsy-44 zwar wichtige cis-regulatorische Element wie PPT und PBS besitzt, die entscheidenden ORFs jedoch fehlen (Jiang et al. 2002a). Im Fall von Dasheng geht man davon aus, dass die Transposition bzw. die dafür notwendigen Proteine durch das autonome Retrotransposon RIRE2 bereitgestellt wurden, dessen cis-regulatorischen Elemente hohe Ähnlichkeit zu denen von Dasheng aufweisen (Jiang et al. 2002b). Ob es sich im Apfel in Bezug auf Gypsy-44 auch so verhält und ebenfalls ein autonomes Transposon mit ähnlichen cis-regulatorischen Elementen die Transposition von Gypsy-44 ermöglichte, oder ob sich unter den zahlreichen weiteren Kopien von Gypsy- 44 im Genom möglicherweise autonome Vertreter befinden, bleibt offen. In Pflanzen werden Retrotransposons in der Regel stark methyliert (Bennetzen et al. 1994). Diese Cytosin-Methylierungen haben starken Einfluss auf die Transkription, da sie unter anderem die Bindung regulatorischer Proteine verhindern (Ehrlich und Ehrlich 1993). Vermutlich ist die Methylierung eine Art Schutzmechanismus der Pflanze, die die Transposition der Retrotranspons verhindern soll (Hirochika et al. 2000). Da diese bei Retrotransposons über eine RNA-Zwischenstufe funktioniert, ist dieser Mechanismus sehr effektiv. Allerdings hat die Methylierung der Retrotransposons auch einen negativen Effekt auf die Expression benachbarter Gene (Finnegan et al. 1998). Die Komplexität der Methylierung wird am Beispiel des Tabak Retrotransposons Tto1 deutlich. In Arabidopsis wird das aktive Retrotransposon Tto1 methyliert und dadurch inaktiviert, im Tabak hingegen bleibt es selbst bei einer hohen Kopienzahl von über 300 transkriptionell aktiv (Hirochika et al. 2000). Aufgrund der transkriptionellen Aktivität von Gypsy-44 in Blättern und im Sprossapikalmeristem in der untersuchten Region ist eine Methylierung zumindest in diesen Geweben unwahrscheinlich (Otto et al. 2013). Eine genaue Untersuchung der Region sowie anderer Gewebe bedarf spezieller Analyseverfahren, beispielsweise durch die AFLP-basierte Detektion von DNA-Methylierungen (Xu et al. 2000), da nicht absolut ausgeschlossen werden kann, dass die transkriptionelle Aktivität von Gypsy-44 an dieser Position von anderen Gypsy-44-Kopien im Apfelgenom stammt. Die Ursachen für die Aktivität von Retrotransposons sind in der Regel Stresssituationen für die Wirtspflanze (Casacuberta und Santiago 2003). Die Tabak-Retrotransposons Tnt1 und Tto1 sind unter Einwirkung von biotischen und abiotischen Stressfaktoren, die eine 114 DISKUSSION Abwehrreaktion der Pflanze hervorrufen, transkriptionell aktiv (Beguiristain et al. 2001; Takeda et al. 1999). Auslöser für den Stress können beispielsweise Pilz- und Virusbefall oder eine Verletzung der Pflanze sowie UV-Strahlung oder die Herstellung von Zellkulturen sein (Pouteau et al. 1994). Die Verbindung zwischen der Abwehrreaktion einer Pflanze und der Aktivität von Retrotransposons rührt daher, dass die Promotoren einiger Retrotransposons denen der Abwehrgene der Pflanze ähneln (Wessler 1996). Möglicherweise liegt somit die Ursache für die transkriptionelle Aktivität von Gypsy-44 in der identifizierten deutlichen Hochregulation von Genen für die Pflanzenabwehr und Stressreaktion in Blättern von McIntosh Wijcik im Vergleich zu Blättern von McIntosh (Otto et al. 2013). In Abbildung 4.3 sind die möglichen Wirkmechanismen des LTR-Retrotransposons Gypsy-44 in der Zielregion zusammenfassend dargestellt. So könnte Gypsy-44 in Form eines Enhancers auf eine Vielzahl benachbarter Gene wirken. Zudem wäre eine Rolle als Insulator möglich, der Auswirkungen auf die Expression eines etwa 40 kb „downstream“-liegenden Transkriptionsfaktors hätte. Darüber hinaus könnten die Transkripte von Gypsy-44, die sowohl in Blättern von McIntosh Wijcik und im Sprossapikalmeristem von P28 identifiziert wurden, eine Funktion als Protein oder non-coding RNAs haben, die wiederum Auswirkungen auf die genomische Region haben. Über den genauen Wirkmechanismus kann nach den bisherigen Erkenntnissen nur spekuliert werden. 115 DISKUSSION 116 Abbildung 4.3 Mögliche Wirkmechanismen von Gypsy-44 in der Co-Zielregion Die Abbildung zeigt die Lokalisierung des LTR-Retrotransposons Gypsy-44 (Gy-44) im erstellten Gesamtcontig. In grün und rot sind die umliegenden Gene dargestellt. Die Farben beziehen sich auf die Expression im Sprossapikalmeristem von P28 (rot = nicht exprimiert; grün = exprimiert). Der genaue Wirkmechanismus von Gypsy-44, der letztlich zur Ausprägung des kolumnaren Phänotyps führt, konnte nicht endgültig geklärt werden. Ein interessantes Gen in der unmittelbaren Nähe zur Integrationsstelle ist nicht vorhanden. Möglicherweise wirkt das Retrotransposon auf das hochregulierte Gen für einen basischen Helix-Loop-Helix Transkriptionsfaktor (bHLH TF) oder andere dargestellte Gene in Form eines Enhancers, was die gesteigerte Expression in P28 erklären würde. Eine eventuelle Methylierung des Retrotransposons könnte ebenfalls Auswirkung auf die Gene in dieser Region haben. Da das Retrotransposon in der Apfelsorte Wijcik (Blatt) und P28 (Sprossapikalmeristem) transkriptionell aktiv ist, könnten die Transkripte in Form eines möglichen Proteins oder in Form von small RNAs eine Wirkung auf die dargestellte Region haben. Unterhalb der exprimierten Gene ist die Information über deren Regulation (hoch- oder herunterreguliert) in Form eines Pfeiles dargestellt. Die Daten zur Genanordnung und zu den Expressionsniveaus stammen zum Teil aus der Doktorarbeit von Romina Petersen und beziehen sich auf das Sprossapikalmeristem von P28 im Vergleich zu A14. ZUSAMMENFASSUNG 5 Zusammenfassung Im Rahmen dieser Arbeit sollten die molekularen Grundlagen der Co-Mutation, die für die kolumnare Wuchsform von Apfelbäumen verantwortlich ist, aufgeklärt werden. Die bisherigen Erkenntnisse hinsichtlich der Lokalisierung und der Struktur der Co-Mutation sind trotz der großen wirtschaftlichen Bedeutung begrenzt. Durch eine klassische positionelle Klonierungsstrategie in Kombination mit genomischen Illumina Next-Generation Sequencing-Datensätzen konnte eine etwa 850 kb große Referenzsequenz der Co-Zielregion der kolumnaren Apfelsorte Procats 28 erstellt und verifiziert werden. Auf Basis dieser Referenz konnte die Co-Mutation in Form der Integration des LTR-Retrotransposons Gypsy-44 im kolumnaren Chromosom an Position 18,79 Mbp auf Chromosom 10 lokalisiert und die Integration von Gypsy-44 als einziger Unterschied zwischen McIntosh und McIntosh Wijcik identifiziert werden. Die Existenz eines „Co-Gens“ über das Gypsy-44 Transposon hinaus kann aufgrund der Analyse der Gene in der überlappenden Zielregion von Baldi et al. (2012) und Moriya et al. (2012) sowie den angrenzenden Bereichen ausgeschlossen werden (Doktorarbeit Romina Petersen, IMSB). Zudem ist ein weiteres Ereignis neben der Integration von Gypsy-44 innerhalb eines so begrenzten Chromosomenabschnittes zur etwa gleichen Zeit als höchst unwahrscheinlich einzustufen. Anhand der durchgeführten Markeranalysen konnte eine direkte Kopplung zwischen der Integration des Retrotransposons Gypsy-44 und dem kolumnaren Phänotyp hergestellt werden, allerdings ist der direkte Zusammenhang mit dem kolumnaren Phänotyp noch ungeklärt. Die Aufklärung des Wirkmechanismus gestaltet sich als schwierig, da durch die Integration kein Gen direkt betroffen ist. Zudem ist eine Integration des Gypsy-44 Retrotransposons in eine nicht kolumnare Apfelsorte durch Transformationsexperimente nahezu unmöglich, da höchstwahrscheinlich nicht das Retrotransposon an sich, sondern die Integration an Position 18,79 auf Chromosom 10 für den Co-Phänotyp verantwortlich ist. Dennoch könnten durch die Überexpression benachbarter Gene in normalwüchsigen Apfelbäumen, oder das Ausschalten dieser in kolumnaren Bäumen, mögliche Wirkmechanismen identifiziert werden. Durch die Etablierung der Transposon-basierenden Marker ist es gelungen, die bisher ersten und einzigen molekularen Marker zu erstellen, die in Bezug auf die Co-Mutation sortenunabhängig sind und somit eine verlässliche Genotypisierung von Apfelbäumen in Bezug auf das Kolumnarwachstum ermöglichen. 117 ABKÜRZUNGSVERZEICHNIS Abkürzungsverzeichnis % Prozent A14 A14-190-93 abs. absolut Ac Activator AFLP amplified fragment length polymorphism AMI GmbH Agrarmarkt Informations-Gesellschaft mbH BAC Bacterial Artificial Chromosome BLAST Basic Local Alignment Search Tool bp Basenpaare BPB Bromphenolblau BpMADS4 Betula pendula MADS4 Bq Becquerel br broomy BSA bovine serum albumin bspw. beispielsweise bzw. beziehungsweise ca. circa CI Chloroform/Isoamylalkohol cM centiMorgan CNS conserved non-coding sequence Co-Gen Kolumnargen Dam DNA adenine methylase dATP Desoxyadenosintriphosphat dCTP Desoxycytosintriphosphat dGTP Desoxyguanosintriphosphat DMF Dimethylformamid DNA Desoxyribonukleinsäure dNTP Desoxynukleosidtriphosphat Ds Dissociator dTTP Desoxythymidintriphosphat E. coli Escherichia coli EDTA Ethylendiamintetraacetat EN Endonuklease E-Puffer Natriumphosphatpuffer-System et al. et alii/aliae/alia EtBr Ethidiumbromid Fa. Firma FAO Food and Agriculture Organization of the United Nations FWA FLOWERING WAGENINGEN GAG Capsid Protein GD Golden Delicious GDR Genome Database for Rosaceae 118 ABKÜRZUNGSVERZEICHNIS GWD genomweite Duplikation h Stunde ha Hektar hAT hobo-Ac-Tam3 HPLC high-performance liquid chromatography IAA Indol-3-essigsäure INT Integrase IMSB Institut für Molekulargenetik, gentechnologische Sicherheitsforschung und Beratung IPTG Isopropyl-1-thio-beta-D-Galactopyranosid kb Kilobase KFH Koloniefilter-Hybridisierung kg Kilogramm kV Kilovolt l Liter LB lysogeny broth LG Linkage Group LINE long interspersed nuclear element lr long range LTR long terminal repeat M Molar mA Milliampere Mbp Megabase MCS multiple cloning site MdPI Malus x domestica PISTILLATA mg Milligramm µg Mikrogramm min Minute Mio. Million MITE Miniature inverted-repeat transposable element ml Milliliter µl Mikroliter mM Millimolar ms Millisekunde Mt Megatonne NaOH Natriumhydroxid NCBI National Center for Biotechnology Information nm Nanometer OD Optische Dichte P28 Procats 28 PAC P-1 derived Artificial Chromosome PBS primer binding site PCI Phenol/Chloroform/Isoamylalkohol PCR Polymerase-Ketten-Reaktion PEG Polyethylenglycol 119 ABKÜRZUNGSVERZEICHNIS pers. persönlich pg Picogramm pH potentia Hydrogenii PM Präinkubationsmedium PPT polpurine tract PR Protease PVP Polyvinylpyrrolidon RAPD random amplified polymorphic DNA RFLP restriction fragment length polymorphism RH RNaseH RNA Ribonukleinsäure RNase Ribonuklease RT Reverse Transkriptase RTE retrotransposable element s Sekunde SCAR sequence characteristic amplified region SDS Sodiumdodecylsulfat SINE short interspersed nuclear element SNP single nucleotide polymorphism s.o. siehe oben SSC Standard-Salz-Citrat SSR simple sequence repeat TAGI The Arabidopsis Genome Initiative tb1 teosinte branched 1 TBE Tris-Borat-EDTA TE Tris-EDTA TIR terminal inverted repeat Tpase Transposase TS Target Site TSD Target Site Duplication u.a. unter anderem ü.N. über Nacht Upm Umdrehungen pro Minute UV ultraviolett V Volt Vdf Verband der deutschen Fruchtsaft-Industrie e.V. VE voll entsalzt vergl. vergleiche Vgt1 Vegetative to generative transition 1 Wx Waxy X-Gal 5-Brom-4-chlor-3-indolyl-alpha-D-galactopyranosid YAC Yeast Artificial Chromosome ZmRAP2.7 Zea mays RAP2.7 120 ABBILDUNGSSVERZEICHNIS Abbildungsverzeichnis Abbildung 1.1 Kolumnare Apfelbäume .................................................................................... 4 Abbildung 1.2 Transposable Elemente in Pflanzen ................................................................ 10 Abbildung 1.3 Co-Gen gekoppelte Marker ............................................................................ 18 Abbildung 2.1 Verwendete Molekulargewichtsstandards der Fa. Fermentas ...................... 21 Abbildung 2.2 Restriktionsschnittstelle Sau3AI ..................................................................... 30 Abbildung 3.1 Vereinfachte genetische bzw. physikalische Karte der Co-Gen-Region ......... 49 Abbildung 3.2 Gelelektrophoretische Auftrennung genomischer P28-DNA ......................... 50 Abbildung 3.3 Restriktionsverdaus der Plasmide ausgewählter BAC-Klone .......................... 53 Abbildung 3.4 „Pirotta“ Blot potenzieller Sonden ................................................................. 55 Abbildung 3.5 Restriktionskartierung des BAC-Klons 3G6 ..................................................... 59 Abbildung 3.6 Tatsächliche Abstände der „mate pair“-Reads ............................................... 61 Abbildung 3.7 Mapping der „mate pair“-Reads gegen die BAC-Klone K2_3 und 2I4 ............ 63 Abbildung 3.8 Schema des BAC-Klons 2I4 inklusive BLASTn-Treffern ................................... 64 Abbildung 3.9 Southern Blots des BAC-Klons 2I4 .................................................................. 65 Abbildung 3.10 Co-Zielregion auf Chromosom 10, Position 18 bis 19 Mbp .......................... 67 Abbildung 3.11 Mapping der „mate pair“-Reads gegen den Gesamtcontig ......................... 68 Abbildung 3.12 Metacontigs vs. GD-Genom Teil I ................................................................. 69 Abbildung 3.13 Metacontigs vs. GD-Genom Teil II ................................................................ 70 Abbildung 3.14 Metacontigs vs. GD-Genom Teil III ............................................................... 71 Abbildung 3.15 Gypsy-44 in der Region um 18,79 Mbp auf Chromosom 10 ........................ 74 Abbildung 3.16 Annotierte Gene im erstellten Gesamtcontig .............................................. 75 Abbildung 3.17 Annotierte transposable Elemente in der Zielregion ................................... 80 Abbildung 3.18 Größenverteilung der annotierten transposablen Elemente ....................... 81 Abbildung 3.19 Annotierte Gene und transposable Elemente im Gesamtcontig Teil I ......... 83 Abbildung 3.20 Annotierte Gene und transposable Elemente im Gesamtcontig Teil II ........ 84 Abbildung 3.21 Potenzielle Co-Gen gekoppelte Marker ....................................................... 86 Abbildung 3.22 S1-Nuklease-Verdau ausgewählter Co-Gen gekoppelter Marker ................ 87 Abbildung 3.23 Feinkartierung der Co-Zielregion .................................................................. 89 Abbildung 3.24 Markertests zur Feinkartierung der Zielregion ............................................. 90 Abbildung 3.25 Genotypisierung der Apfelsorte Topaz mittels verschiedener Marker ........ 93 Abbildung 3.26 Gypsy-44-basierende Primer ........................................................................ 94 Abbildung 3.27 Gypsy-44-spezifische PCR auf genomische DNAs diverser Apfelsorten ....... 95 Abbildung 4.1 Co-Zielregion ................................................................................................... 98 Abbildung 4.2 Evolution des Apfelgenoms .......................................................................... 102 Abbildung 4.3 Mögliche Wirkmechanismen von Gypsy-44 in der Co-Zielregion ................. 116 Abbildung A1.1 Vektorkarten Teil I ...................................................................................... 137 Abbildung A1.2 Vektorkarten Teil II ..................................................................................... 138 Abbildung A3.1 QIAxcel-Lauf ............................................................................................... 141 Abbildung A4.1 Markertests diverser Apfelsorten .............................................................. 142 121 TABELLENVERZEICHNIS Tabellenverzeichnis Tabelle 1.1 Eine Auswahl sequenzierter Pflanzengenome ...................................................... 7 Tabelle 2.1 Standard PCR-Ansatz ........................................................................................... 24 Tabelle 2.2 PCR-Programm ..................................................................................................... 24 Tabelle 2.3 „long range“ PCR-Ansatz...................................................................................... 24 Tabelle 2.4 „long range“ PCR-Programm ............................................................................... 24 Tabelle 2.5 Endfilling (radioaktiv) ........................................................................................... 30 Tabelle 2.6 Ligationsansatz .................................................................................................... 31 Tabelle 2.7 Restriktionsansatz BAC-Minipräparation............................................................. 33 Tabelle 2.8 Endfilling-Ansatz .................................................................................................. 37 Tabelle 2.9 Ligations-Ansatz ................................................................................................... 37 Tabelle 2.10 Restriktionsansatz pUC ...................................................................................... 38 Tabelle 2.11 Verwendete Perl-Skripte ................................................................................... 39 Tabelle 2.12 Parameter der Assembly Cell ............................................................................. 40 Tabelle 2.13 Restriktionsenzyme und Puffer ......................................................................... 41 Tabelle 3.1 Strahlungsintensitäten zur Überprüfung der Integrat-Enden ............................. 52 Tabelle 3.2 Integratgrößen ausgewählter BAC-Klone ............................................................ 54 Tabelle 3.3 BAC-DNA-Bibliotheken der Apfelsorte Procats 28 .............................................. 54 Tabelle 3.4 Lokalisierung positiver BAC-Klone der Koloniefilter-Hybridisierung ................... 56 Tabelle 3.5 BAC-Klone aus der Co-Zielregion ......................................................................... 57 Tabelle 3.6 Berechnete Fragmentgrößen des Klons 3G6 ....................................................... 59 Tabelle 3.7 Statistische Auswertung der genomischen Illumina „mate pair“-Reads ............. 61 Tabelle 3.8 Statistische Analyse von Duplikaten in den „mate pair“-Bibliotheken ............... 62 Tabelle 3.9 Zusammensetzung chimärer BAC-Klone.............................................................. 63 Tabelle 3.10 Erwartete Fragmentgrößen der Southern Blot Analysen des BAC-Klons 2I4 .... 64 Tabelle 3.11 Identifizierte Indels in der Co-Zielregion ........................................................... 73 Tabelle 3.12 Im GD-Genom annotierte Gene in der Zielregion ............................................. 77 Tabelle 3.13 Potenzielle Co-Gen gekoppelte Marker ............................................................. 85 Tabelle 3.14 Markertests auf diverse Apfelsorten ................................................................. 91 Tabelle A2.1 Sonden in der Zielregion für die KFH Runde I (Sondenpool I) ......................... 139 Tabelle A2.2 Sonden in der Zielregion für die KFH Runde II (Sondenpool II) ....................... 139 Tabelle A2.3 Sonden in der Zielregion für die KFH Runde III (Sondenpool III) ..................... 140 Tabelle A2.4 Sonden in der Zielregion für die KFH Runde IV (Sondenpool IV) .................... 140 Tabelle A3.1 Plattenbelegung PCR und QIAxcel ................................................................... 141 122 WEBVERZEICHNIS Webverzeichnis AMI GmbH ami-informiert.de „apple genome browser“ genomics.research.iasma.it/gb2/gbrowse/apple BLAST genomics.research.iasma.it/blast/blast.html CENSOR girinst.org/censor FAO faostat.fao.org GDR rosaceae.org PLAZA bioinformatics.psb.ugent.be/plaza Repbase girinst.org/repbase Spidey ncbi.nlm.nih.gov/spidey/ Vdf fruchtsaft.org Vecscreen ncbi.nlm.nih.gov/tools/vecscreen/ 123 LITERATURVERZEICHNIS Literaturverzeichnis Aird D, Ross MG, Chen WS, Danielsson M, Fennell T, Russ C, Jaffe DB, Nusbaum C, Gnirke A (2011) Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries. Genome biology 12 (2):R18 Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990) Basic local alignment search tool. J Mol Biol 215 (3):403-410 Asíns MJ, Monforte AJ, Mestre PF, Carbonell EA (1999) Citrus and Prunuscopia-like retrotransposons. Theor Appl Genet 99 (3-4):503-510 Bai T, Zhu Y, Fernández-Fernández F, Keulemans J, Brown S, Xu K (2012) Fine genetic mapping of the Co locus controlling columnar growth habit in apple. Molecular Genetics and Genomics 287 (5):437-450 Baldi P, Wolters P, Komjanc M, Viola R, Velasco R, Salvi S (2012) Genetic and physical characterisation of the locus controlling columnar habit in apple (Malus × domestica Borkh.). Molecular Breeding:1-12 Beckmann JS (1988) Oligonucleotide Polymorphisms: A New Tool for Genomic Genetics. Nat Biotech 6 (9):1061-1064 Beek JG, Verkerk R, Zabel P, Lindhout P (1992) Mapping strategy for resistance genes in tomato based on RFLPs between cultivars: Cf9 (resistance to Cladosporium fulvum) on chromosome 1. TAG Theoretical and Applied Genetics 84 (1):106-112 Beguiristain T, Grandbastien MA, Puigdomenech P, Casacuberta JM (2001) Three Tnt1 subfamilies show different stress-associated patterns of expression in tobacco. Consequences for retrotransposon control and evolution in plants. Plant physiology 127 (1):212-221 Bell AC, Felsenfeld G (1999) Stopped at the border: boundaries and insulators. Current opinion in genetics & development 9 (2):191-198 Bennetzen J (2000) Transposable element contributions to plant gene and genome evolution. Plant Mol Biol 42 (1):251-269 Bennetzen JL (1996) The contributions of retroelements to plant genome organization, function and evolution. Trends in Microbiology 4 (9):347-353 Bennetzen JL, Schrick K, Springer PS, Brown WE, SanMiguel P (1994) Active maize genes are unmodified and flanked by diverse classes of modified, highly repetitive DNA. Genome 37 (4):565-576 Blažek J (1992) Segregation and general evaluation of spur type or compact growth habits in apples. Acta Hortic 317:71-79 Blobel G, Potter VR (1966) Nuclei from Rat Liver: Isolation Method That Combines Purity with High Yield. Science 154 (3757):1662-1665 Botstein D, White RL, Skolnick M, Davis RW (1980) Construction of a genetic linkage map in man using restriction fragment length polymorphisms. American journal of human genetics 32 (3):314-331 Boyer J, Liu R (2004) Apple phytochemicals and their health benefits. Nutrition Journal 3 (1):5 Buhariwalla H, Greaves S, Magrath R, Mithen R (1995) Development of specific PCR primers for the amplification of polymorphic DNA from the obligate root pathogen Plasmodiophora brassicae. Physiological and Molecular Plant Pathology 47 (2):83-94 124 LITERATURVERZEICHNIS Bundock P, Hooykaas P (2005) An Arabidopsis hAT-like transposase is essential for plant development. Nature 436 (7048):282-284 Bureau TE, Wessler SR (1992) Tourist: a large family of small inverted repeat elements frequently associated with maize genes. The Plant cell 4 (10):1283- 1294 Bureau TE, Wessler SR (1994) Stowaway: a new family of inverted repeat elements associated with the genes of both monocotyledonous and dicotyledonous plants. The Plant cell 6 (6):907-916 Burgoyne LA, Waqar MA, Atkinson MR (1970) Calcium-dependent priming of DNA synthesis in isolated rat liver nuclei. Biochemical and Biophysical Research Communications 39 (2):254-259 Burke D, Carle G, Olson M (1987) Cloning of large segments of exogenous DNA into yeast by means of artificial chromosome vectors. Science 236 (4803):806-812 Busov V, Johannes E, Whetten R, Sederoff R, Spiker S, Lanz-Garcia C, Goldfarb B (2004) An auxin-inducible gene from loblolly pine (Pinus taeda L.) is differentially expressed in mature and juvenile-phase shoots and encodes a putative transmembrane protein. Planta 218 (6):916-927 Calladine CR, Collis CM, Drew HR, Mott MR (1991) A study of electrophoretic mobility of DNA in agarose and polyacrylamide gels. J Mol Biol 221 (3):981- 1005 Casacuberta JM, Santiago N (2003) Plant LTR-retrotransposons and MITEs: control of transposition and impact on the evolution of plant genes and genomes. Gene 311:1-11 Chagné D, Gasic K, Crowhurst RN, Han Y, Bassett HC, Bowatte DR, Lawrence TJ, Rikkerink EHA, Gardiner SE, Korban SS (2008) Development of a set of SNP markers present in expressed genes of the apple. Genomics 92 (5):353-358 Chaisson MJ, Brinza D, Pevzner PA (2009) De novo fragment assembly with short mate-paired reads: Does the read length matter? Genome Research 19 (2):336-346 Chevreau E, Lespinasse Y, Gallet M (1985) Inheritance of pollen enzymes and polyploid origin of apple (Malus x domestica Borkh.). TAG Theoretical and Applied Genetics 71 (2):268-277 Choi S, Creelman R, Mullet J, Wing R (1995) Construction and characterization of a bacterial artificial chromosome library ofArabidopsis thaliana. Plant Mol Biol Rep 13 (2):124-128 Clarke L, Carbon J (1976) A colony bank containing synthetic CoI EI hybrid plasmids representative of the entire E. coli genome. Cell 9 (1):91-99 Claros MG, Bautista R, Guerrero-Fernández D, Benzerki H, Seoane P, Fernández- Pozo N (2012) Why Assembling Plant Genome Sequences Is So Challenging. Biology 1 (2):439-459 Conesa A, Götz S (2008) Blast2GO: A Comprehensive Suite for Functional Analysis in Plant Genomics. International Journal of Plant Genomics 2008 Conner PJ, Brown SK, Weeden NF (1997) Randomly Amplified Polymorphic DNA- based Genetic Linkage Maps of Three Apple Cultivars. J Amer Soc Hort Sci 122 (3):350-359 Cornille A, Gladieux P, Smulders MJM, Roldán-Ruiz I, Laurens F, Le Cam B, Nersesyan A, Clavel J, Olonova M, Feugey L et al. (2012) New Insight into the History of Domesticated Apple: Secondary Contribution of the European 125 LITERATURVERZEICHNIS Wild Apple to the Genome of Cultivated Varieties. PLoS Genet 8 (5):e1002703 de Bruijn NG, Erdos P (1946) A combinatorial problem. Koninklijke Nederlandse Akademie v Wetenschappen 49 (49):758-764 Denhardt DT (1966) A membrane-filter technique for the detection of complementary DNA. Biochemical and Biophysical Research Communications 23 (5):641-646 Doebley JF, Gaut BS, Smith BD (2006) The Molecular Genetics of Crop Domestication. Cell 127 (7):1309-1321 Dower WJ, Miller JF, Ragsdale CW (1988) High efficiency transformation of E.coli by high voltage electroporation. Nucleic acids research 16 (13):6127-6145 Ehrlich M, Ehrlich KC (1993) Effect of DNA methylation on the binding of vertebrate and plant proteins to DNA. Exs 64:145-168 Evans RC, Campbell CS (2002) The origin of the apple subfamily (Maloideae; Rosaceae) is clarified by DNA sequence data from duplicated GBSSI genes. American journal of botany 89 (9):1478-1484 Feinberg AP, Vogelstein B (1983) A technique for radiolabeling DNA restriction endonuclease fragments to high specific activity. Anal Biochem 132 (1):6-13 Fernández-Fernández F, Evans K, Clarke J, Govan C, James C, Marič S, Tobutt K (2008) Development of an STS map of an interspecific progeny of Malus. Tree Genetics & Genomes 4 (3):469-479 Fernández-Fernández F, Harvey NG, James CM (2006) Isolation and characterization of polymorphic microsatellite markers from European pear (Pyrus communis L.). Molecular Ecology Notes 6 (4):1039-1041 Feschotte C, Jiang N, Wessler SR (2002) Plant transposable elements: where genetics meets genomics. Nat Rev Genet 3 (5):329-341 Feschotte C, Swamy L, Wessler SR (2003) Genome-Wide Analysis of mariner-Like Transposable Elements in Rice Reveals Complex Relationships With Stowaway Miniature Inverted Repeat Transposable Elements (MITEs). Genetics 163 (2):747-758 Finnegan DJ (1989) Eukaryotic transposable elements and genome evolution. Trends in Genetics 5 (0):103-107 Finnegan EJ, Genger RK, Peacock WJ, Dennis ES (1998) DNA Methylation in Plants. Annual review of plant physiology and plant molecular biology 49:223-247 Fisher DV (1969) Spur-type strains of McIntosh for high density plantings. British Columbia Fruit Growers' Association Quarterly Report 14 (2):3-10 Fisher DV (1970) Spur strains of 'McIntosh' discovered in British Colombia, Canada. Fruit Var Hort Dig 24:27-32 Flachowsky H, Hättasch C, Höfer M, Peil A, Hanke M-V (2010) Overexpression of LEAFY in apple leads to a columnar phenotype with shorter internodes. Planta 231 (2):251-263 Flachowsky H, Le Roux P-M, Peil A, Patocchi A, Richter K, Hanke M-V (2011) Application of a high-speed breeding technology to apple (Malus × domestica) based on transgenic early flowering plants and marker- assisted selection. New Phytologist 192 (2):364-377 Forsline PL, Aldwinckle HS, Dickson EE, Luby JJ, Hokanson SC (2002) Collection, Maintenance, Characterization, and Utilization of Wild Apples of Central Asia. Horticultural Reviews. John Wiley & Sons, Inc., 126 LITERATURVERZEICHNIS Fujimoto R, Kinoshita Y, Kawabe A, Kinoshita T, Takashima K, Nordborg M, Nasrallah ME, Shimizu KK, Kudoh H, Kakutani T (2008) Evolution and Control of Imprinted FWA Genes in the Genus Arabidopsis. PLoS Genet 4 (4):e1000048 Gause M, Morcillo P, Dorsett D (2001) Insulation of enhancer-promoter communication by a gypsy transposon insert in the Drosophila cut gene: cooperation between suppressor of hairy-wing and modifier of mdg4 proteins. Molecular and cellular biology 21 (14):4807-4817 Gaut BS, Morton BR, McCaig BC, Clegg MT (1996) Substitution rate comparisons between grasses and palms: synonymous rate differences at the nuclear gene Adh parallel rate differences at the plastid gene rbcL. Proceedings of the National Academy of Sciences 93 (19):10274-10279 Gerhauser C (2008) Cancer chemopreventive potential of apples, apple juice, and apple components. Planta Med 74 (13):1608-1624 Grant SG, Jessee J, Bloom FR, Hanahan D (1990) Differential plasmid rescue from transgenic mouse DNAs into Escherichia coli methylation-restriction mutants. Proceedings of the National Academy of Sciences 87 (12):4645-4649 Green ED (2001) Strategies for the systematic sequencing of complex genomes. Nature reviews Genetics 2 (8):573-583 Green ED, Riethman HC, Dutchik JE, Olson MV (1991) Detection and characterization of chimeric yeast artificial-chromosome clones. Genomics 11 (3):658-669 Gregory TR (2005) The C-value Enigma in Plants and Animals: A Review of Parallels and an Appeal for Partnership. Annals of Botany 95 (1):133-146 Grunstein M, Hogness DS (1975) Colony hybridization: a method for the isolation of cloned DNAs that contain a specific gene. Proceedings of the National Academy of Sciences 72 (10):3961-3965 Hagerman PJ (1984) Evidence for the existence of stable curvature of DNA in solution. Proceedings of the National Academy of Sciences 81 (15):4632-4636 Hamilton JP, Robin Buell C (2012) Advances in plant genome sequencing. The Plant Journal 70 (1):177-190 Hamrick J, Godt M, Brown A, Clegg M, Kahler A, Weir B (1990) Allozyme diversity in plant species. Plant population genetics, breeding, and genetic resources:43-63 Hattman S, Brooks JE, Masurekar M (1978) Sequence specificity of the P1 modification methylase (M.Eco P1) and the DNA methylase (M.Eco dam) controlled by the Escherichia coli dam gene. J Mol Biol 126 (3):367-380 Heim MA, Jakoby M, Werber M, Martin C, Weisshaar B, Bailey PC (2003) The Basic Helix–Loop–Helix Transcription Factor Family in Plants: A Genome-Wide Study of Protein Structure and Functional Diversity. Molecular Biology and Evolution 20 (5):735-747 Hemmat M, Weeden NF, Conner PJ, Brown SK (1997) A DNA Marker for Columnar Growth Habit in Apple Contains a Simple Sequence Repeat. J Amer Soc Hort Sci 122 (3):347-349 Hemmat M, Weeden NF, Manganaris AG, Lawson DM (1994) Molecular marker linkage map for apple. The Journal of heredity 85 (1):4-11 Herold T (2012) Vergleichende Analyse der Gene und der Genomstruktur der geschlechtsbestimmenden Chromosomenregion von Chironomus und Camptochironomus. Dissertation, Johannes Gutenberg Universität, Mainz 127 LITERATURVERZEICHNIS Hily JM, Singer SD, Yang Y, Liu Z (2009) A transformation booster sequence (TBS) from Petunia hybrida functions as an enhancer-blocking insulator in Arabidopsis thaliana. Plant cell reports 28 (7):1095-1104 Hirochika H, Okamoto H, Kakutani T (2000) Silencing of retrotransposons in arabidopsis and reactivation by the ddm1 mutation. The Plant cell 12 (3):357- 369 Hopf M (1973) Apfel (Malus communis L.); Aprikose (Prunus armeniaca L.), vol 1. Reallexikon der Germanischen Altertumskunde. Walter de Gruyter, Ikase L, Dumbravs R (2004) Breeding of columnar apple-trees in Latvia. Biologija 2:8-10 Imelfort M, Edwards D (2009) De novo sequencing of plant genomes using second- generation technologies. Briefings in Bioinformatics 10 (6):609-618 Ioannou PA, Amemiya CT, Garnes J, Kroisel PM, Shizuya H, Chen C, Batzer MA, de Jong PJ (1994) A new bacteriophage P1-derived vector for the propagation of large human DNA fragments. Nature genetics 6 (1):84-89 Jacob HB (2010) Breeding experiments of apple varieties with columnar growth and low chilling requirements. Acta Hortic 872 (159-164) Jaillon O, Aury J, Noel B, Policriti A, Clepet C (2007) The grapevine genome sequence suggests ancestral hexaploidization in major angiosperm phyla. Nature 449 (7161):463-467 Janick J, Cummins JN, Brown SK, Hemmat M (1996) Apples. In Fruit Breeding, Volume I: Tree and Tropical Fruits. Wiley & Sons, Inc. Jiang N, Bao Z, Temnykh S, Cheng Z, Jiang J, Wing RA, McCouch SR, Wessler SR (2002a) Dasheng: A Recently Amplified Nonautonomous Long Terminal Repeat Element That Is a Major Component of Pericentromeric Regions in Rice. Genetics 161 (3):1293-1305 Jiang N, Feschotte C, Zhang X, Wessler SR (2004) Using rice to understand the origin and amplification of miniature inverted repeat transposable elements (MITEs). Current Opinion in Plant Biology 7 (2):115-119 Jiang N, Jordan IK, Wessler SR (2002b) Dasheng and RIRE2. A Nonautonomous Long Terminal Repeat Element and Its Putative Autonomous Partner in the Rice Genome. Plant Physiology 130 (4):1697-1705 Juniper BE, Mabberley DJ (2006) The story of the apple. Timber Press, Jurka J, Kapitonov VV, Pavlicek A, Klonowski P, Kohany O, Walichiewicz J (2005) Repbase Update, a database of eukaryotic repetitive elements. Cytogenetic and genome research 110 (1-4):462-467 Kapitonov VV, Jurka J (2001) Rolling-circle transposons in eukaryotes. Proceedings of the National Academy of Sciences 98 (15):8714-8719 Kaufmann P, Pfefferkorn A, Teuber M, Meile L (1997) Identification and quantification of Bifidobacterium species isolated from food with genus- specific 16S rRNA-targeted probes by colony hybridization and PCR. Applied and Environmental Microbiology 63 (4):1268-1273 Kenis K, Keulemans J (2007) Study of Tree Architecture of Apple (Malus × domestica Borkh.) by QTL Analysis of Growth Traits. Mol Breeding 19:193-208 Kim JM, Vanguri S, Boeke JD, Gabriel A, Voytas DF (1998) Transposable elements and genome organization: a comprehensive survey of retrotransposons revealed by the complete Saccharomyces cerevisiae genome sequence. Genome research 8 (5):464-478 128 LITERATURVERZEICHNIS Kim MY, Song KJ, Hwang J-H, Shin Y-U, Lee HJ (2003) Development of RAPD and SCAR markers linked to the Co gene conferring columnar growth habit in apple (Malus pumila Mill.). Journal of Horticultural Science & Biotechnology 78 (4):512-517 Kim U-J, Birren BW, Slepak T, Mancino V, Boysen C, Kang H-L, Simon MI, Shizuya H (1996) Construction and Characterization of a Human Bacterial Artificial Chromosome Library. Genomics 34 (2):213-218 Kinoshita Y, Saze H, Kinoshita T, Miura A, Soppe WJJ, Koornneef M, Kakutani T (2007) Control of FWA gene silencing in Arabidopsis thaliana by SINE- related direct repeats. The Plant Journal 49 (1):38-45 Kobayashi S, Goto-Yamamoto N, Hirochika H (2004) Retrotransposon-Induced Mutations in Grape Skin Color. Science 304 (5673):982-982 Kohany O, Gentles A, Hankus L, Jurka J (2006) Annotation, submission and screening of repetitive elements in Repbase: RepbaseSubmitter and Censor. BMC Bioinformatics 7 (1):474 Koo HS, Wu HM, Crothers DM (1986) DNA bending at adenine . thymine tracts. Nature 320 (6062):501-506 Korban SS, Chen H (1992) Apple. In: Biotechnology of perennial fruit crops, Biotechnology in agriculture, vol 8. CAB International, Wallingford, UK, pp 203-227 Korban SS, Skirvin RM (1984) Nomenclature of the domesticated apple. Hort Science 19:177-180 Krost C (2012) Transkriptom des Meristemgewebes des Kolumnarapfels. Dissertation, Johannes Gutenberg Universität, Mainz Krost C, Petersen R, Schmidt ER (2012) The transcriptomes of columnar and standard type apple trees (Malus x domestica) - A comparative study. Gene 498:223-230 Kumar A, Bennetzen JL (1999) Plant Retrotransposons. Annual Review of Genetics 33 (1):479-532 Kumar S, Blaxter ML (2010) Comparing de novo assemblers for 454 transcriptome data. BMC genomics 11:571 Kwok P-Y (2001) Methods for Genotyping Single Nucleotide Polymorphisms. Annual Review of Genomics and Human Genetics 2 (1):235-258 Langmead B, Trapnell C, Pop M, Salzberg S (2009) Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology 10 (3):R25 Lapins KO (1969) Segregation of compact growth types in certain apple seedling progenies. Canadian Journal of Plant Science 49:765-768 Lapins KO (1976) Inheritance of compact growth type in apple. J Am Soc Hort Sci 101:133-135 Lapins KO, Watkins R (1973) Genetics of compact growth habit. Report of East Malling Research Station for 1972 136 Lee JM, Looney NE (1977) Absisic Acid Levels and Genetic Compaction in Apple Seedlings. Canad J Plant Sci 57 (1):81-85 Li R, Fan W, Tian G, Zhu H, He L, Cai J, Huang Q, Cai Q, Li B, Bai Y et al. (2010) The sequence and de novo assembly of the giant panda genome. Nature 463 (7279):311-317 Liebhard R, Gianfranceschi L, Koller B, Ryder CD, Tarchini R, Van de Weg E, Gessler C (2002) Development and characterisation of 140 new 129 LITERATURVERZEICHNIS microsatellites in apple (Malus x domestica Borkh.). Molecular Breeding 10:217-241 Lisch D (2009) Epigenetic regulation of transposable elements in plants. Annual review of plant biology 60:43-66 Lisch D (2013) How important are transposons for plant evolution? Nat Rev Genet 14 (1):49-61 Litt M, Luty JA (1989) A hypervariable microsatellite revealed by in vitro amplification of a dinucleotide repeat within the cardiac muscle actin gene. American journal of human genetics 44 (3):397-401 Looney NE, Lane WD (1984) Spur-type growth mutants of McIntosh apple: A review of their genetics, physiology and field performance. Acta Hortic 146:31-46 Luby JJ (2003) Apples: Botany, Production and Uses. CABI Publishing, Luo M-C, Thomas C, You FM, Hsiao J, Ouyang S, Buell CR, Malandro M, McGuire PE, Anderson OD, Dvorak J (2003) High-throughput fingerprinting of bacterial artificial chromosomes using the snapshot labeling kit and sizing of restriction fragments by capillary electrophoresis. Genomics 82 (3):378-389 Lynch M, Walsh JB (1998) Genetics and Analysis of Quantitative Traits. Sinauer Assocs., Inc., Sunderland, MA. , Maliepaard C, Alston FH, van Arkel G, Brown LM, Chevreau E, Dunemann F, Evans KM, Gardiner S, Guilford P, van Heusden AW et al. (1998) Aligning male and female linkage maps of apple (Malus pumila Mill.) using multi- allelic markers. TAG Theoretical and Applied Genetics 97 (1):60-73 Malik HS, Eickbush TH (1998) The RTE class of non-LTR retrotransposons is widely distributed in animals and is the origin of many SINEs. Molecular Biology and Evolution 15 (9):1123-1134 Malnoy M, Jin Q, Borejsza-Wysocka EE, He SY, Aldwinckle HS (2007) Overexpression of the Apple MpNPR1 Gene Confers Increased Disease Resistance in Malus × domestica. Molecular Plant-Microbe Interactions 20 (12):1568-1580 Marini JC, Levene SD, Crothers DM, Englund PT (1982) Bent helical structure in kinetoplast DNA. Proceedings of the National Academy of Sciences 79 (24):7664-7668 McClintock B (1944) The Relation of Homozygous Deficiencies to Mutations and Allelic Series in Maize. Genetics 29 (5):478-502 McClintock B (1946) Maize genetics. Year book - Carnegie Institution of Washington 45:176-186 McClintock B (1950) The origin and behavior of mutable loci in maize. Proceedings of the National Academy of Sciences of the United States of America 36 (6):344-355 McClintock B (1951) Chromosome Organization and Genic Expression. Cold Spring Harbor Symposia on Quantitative Biology 16:13-47 McClintock B (1953) Induction of Instability at Selected Loci in Maize. Genetics 38 (6):579-599 Meinkoth J, Wahl G (1984) Hybridization of Nucleic Acids Immobilized on Solid Supports. Analytical Biochemistry 138:267-284 Meulenbroek B, Verhaegh J, Janse J (1998) Inheritance Studies with Columnar Type Trees. Acta Hort 484:255-260 130 LITERATURVERZEICHNIS Miller JR, Koren S, Sutton G (2010) Assembly algorithms for next-generation sequencing data. Genomics 95 (6):315-327 Minoche AE, Dohm JC, Himmelbauer H (2011) Evaluation of genomic high- throughput sequencing data generated on Illumina HiSeq and genome analyzer systems. Genome biology 12 (11):R112 Monaco AP, Larin Z (1994) YACs, BACs, PACs and MACs: Artificial chromosomes as research tools. Trends in Biotechnology 12 (7):280-286 Morgan J, Richards A (1993) The book of apples. Ebury Press, London, Morgante M, Olivieri AM (1993) PCR-amplified microsatellites as markers in plant genetics. The Plant Journal 3 (1):175-182 Moriya S, Iwanami H, Kotoda N, Takahashi S, Yamamoto T, Kazuyuki A (2009) Development of a Marker-assisted Selection System for Columnar Growth Habit in Apple Breeding. J Japan Soc Hort Sci 78 (3):279-287 Moriya S, Okada K, Haji T, Yamamoto T, Abe K (2012) Fine mapping of Co, a gene controlling columnar growth habit located on apple (Malus×domestica Borkh.) linkage group 10. Plant Breeding:no-no Muehlbauer G, Bhau B, Syed N, Heinen S, Cho S, Marshall D, Pateyron S, Buisine N, Chalhoub B, Flavell A (2006) A hAT superfamily transposase recruited by the cereal grass genome. Molecular Genetics and Genomics 275 (6):553-563 Mullis K, Faloona F, Scharf S, Saiki R, Horn G, Erlich H (1992) Specific enzymatic amplification of DNA in vitro: the polymerase chain reaction. 1986. Biotechnology 24:17-27 Myers EW (1995) Toward simplifying and accurately formulating fragment assembly. Journal of computational biology : a journal of computational molecular cell biology 2 (2):275-290 Nagaya S, Yoshida K, Kato K, Akasaka K, Shinmyo A (2001) An insulator element from the sea urchin Hemicentrotus pulcherrimus suppresses variation in transgene expression in cultured tobacco cells. Molecular Genetics and Genomics 265 (3):405-413 Naito K, Zhang F, Tsukiyama T, Saito H, Hancock CN, Richardson AO, Okumoto Y, Tanisaka T, Wessler SR (2009) Unexpected consequences of a sudden and massive transposon amplification on rice gene expression. Nature 461 (7267):1130-1134 Newcomb RD, Crowhurst RN, Gleave AP, Rikkerink EHA, Allan AC, Beuning LL, Bowen JH, Gera E, Jamieson KR, Janssen BJ et al. (2006) Analyses of Expressed Sequence Tags from Apple. Plant Physiology 141 (1):147-166 Okada N (1991a) SINEs. Current opinion in genetics & development 1 (4):498-504 Okada N (1991b) SINEs: Short interspersed repeated elements of the eukaryotic genome. Trends in Ecology & Evolution 6 (11):358-361 Osoegawa K, Tateno M, Woon PY, Frengen E, Mammoser AG, Catanese JJ, Hayashizaki Y, de Jong PJ (2000) Bacterial artificial chromosome libraries for mouse sequencing and functional analysis. Genome research 10 (1):116-128 Osoegawa K, Woon PY, Zhao B, Frengen E, Tateno M, Catanese JJ, de Jong PJ (1998) An improved approach for construction of bacterial artificial chromosome libraries. Genomics 52 (1):1-8 Otto D (2008) Analyse des Kolumnar-Gens. Diplomarbeit, Johannes Gutenberg Universität, Mainz 131 LITERATURVERZEICHNIS Otto D, Petersen R, Brauksiepe B, Braun P, Schmidt ER (2013) The columnar mutation (“Co gene”) of apple (Malus x domestica) is associated with an integration of a Gypsy-like retrotransposon. Molecular Breeding:in press Paran I, Michelmore RW (1993) Development of reliable PCR-based markers linked to downy mildew resistance genes in lettuce. TAG Theoretical and Applied Genetics 85 (8):985-993 Paterson AH, Bowers JE, Bruggmann R, Dubchak I, Grimwood J, Gundlach H, Haberer G, Hellsten U, Mitros T, Poliakov A et al. (2009) The Sorghum bicolor genome and the diversification of grasses. Nature 457 (7229):551-556 Paterson AH, Freeling M, Tang H, Wang X (2010) Insights from the comparison of plant genome sequences. Annual review of plant biology 61:349-372 Patocchi A, Vinatzer BA, Gianfranceschi L, Tartarini S, Zhang HB, Sansavini S, Gessler C (1999) Construction of a 550 kb BAC contig spanning the genomic region containing the apple scab resistance gene Vf. Mol Gen Genet 262 (4- 5):884-891 Petersen R Molekulargenetische Ursachen des Kolumnarwachstums bei Äpfeln. Dissertation, Johannes Gutenberg Universität, Mainz Petersen R, Krost C (2013) Tracing a key player in the regulation of plant architecture: the columnar growth habit of apple trees (Malus × domestica). Planta:1-22 Pevzner PA, Tang H, Tesler G (2004) De Novo Repeat Classification and Fragment Assembly. Genome Research 14 (9):1786-1796 Phipps JB, Robertson KR, Rohrer JR, Smith PG (1991) Origins and Evolution of Subfam. Maloideae (Rosaceae). Systematic Botany 16 (2):303-332 Potter D, Eriksson T, Evans RC, Oh S, Smedmark JEE, Morgan DR, Kerr M, Robertson KR, Arsenault M, Dickinson TA et al. (2007) Phylogeny and classification of Rosaceae. Plant Systematics and Evolution 266 (1):5-43 Pouteau S, Grandbastien M-A, Boccara M (1994) Microbial elicitors of plant defence responses activate transcription of a retrotransposon. The Plant Journal 5 (4):535-542 Prochazka M, Walder K, Xia J (2001) AFLP fingerprinting of the human genome. Hum Genet 108 (1):59-65 Proost S, Pattyn P, Gerats T, Van de Peer Y (2011) Journey through the past: 150 million years of plant genome evolution. The Plant journal : for cell and molecular biology 66 (1):58-65 Proost S, Van Bel M, Sterck L, Billiau K, Van Parys T, Van de Peer Y, Vandepoele K (2009) PLAZA: a comparative genomics resource to study gene and genome evolution in plants. The Plant cell 21 (12):3718-3731 Rickert AM, Kim JH, Meyer S, Nagel A, Ballvora A, Oefner PJ, Gebhardt C (2003) First-generation SNP/InDel markers tagging loci for pathogen resistance in the potato genome. Plant Biotechnology Journal 1 (6):399-410 Robinson JP, Harris SA, Juniper BE (2001) Taxonomy of the genus Malus Mill. (Rosaceae) with emphasis on the cultivated apple, Malus domestica Borkh. Plant Systematics and Evolution 226 (1):35-58 Sajer O, Scorza R, Dardick C, Zhebentyayeva T, Abbott AG, Horn R (2012) Development of sequence-tagged site markers linked to the pillar growth type in peach (Prunus persica). Plant Breeding 131 (1):186-192 Salvi S, Sponza G, Morgante M, Tomes D, Niu X, Fengler KA, Meeley R, Ananiev EV, Svitashev S, Bruggemann E et al. (2007) Conserved noncoding genomic 132 LITERATURVERZEICHNIS sequences associated with a flowering-time quantitative trait locus in maize. Proceedings of the National Academy of Sciences 104 (27):11376-11381 Sambrook J, Fritsch EF, Maniatis T (1989) Molecular cloning, vol 2. Cold spring harbor laboratory press New York, Sanger F, Nicklen S, Coulson AR (1977) DNA sequencing with chain-terminating inhibitors. Proceedings of the National Academy of Sciences 74 (12):5463- 5467 SanMiguel P, Bennetzen JL (1998) Evidence that a Recent Increase in Maize Genome Size was Caused by the Massive Amplification of Intergene Retrotransposons. Annals of Botany 82 (suppl 1):37-44 SanMiguel P, Gaut BS, Tikhonov A, Nakajima Y, Bennetzen JL (1998) The paleontology of intergene retrotransposons of maize. Nat Genet 20 (1):43-45 SanMiguel P, Tikhonov A, Jin Y-K, Motchoulskaia N, Zakharov D, Melake-Berhan A, Springer PS, Edwards KJ, Lee M, Avramova Z et al. (1996) Nested Retrotransposons in the Intergenic Regions of the Maize Genome. Science 274 (5288):765-768 Schatz MC, Delcher AL, Salzberg SL (2010) Assembly of large genomes using second-generation sequencing. Genome Research 20 (9):1165-1173 Schmidt M (1937) Somatische Mutationen beim Kern- und Steinobst und ihre züchterische Bedeutung. Der Zuchter 9 (4):81-91 Schmutz J, Cannon SB, Schlueter J, Ma J, Mitros T, Nelson W, Hyten DL, Song Q, Thelen JJ, Cheng J et al. (2010) Genome sequence of the palaeopolyploid soybean. Nature 463 (7278):178-183 Schnable PS, Ware D, Fulton RS, Stein JC, Wei F, Pasternak S, Liang C, Zhang J, Fulton L, Graves TA et al. (2009) The B73 maize genome: complexity, diversity, and dynamics. Science 326 (5956):1112-1115 Schuster M (2009) Sour cherries Prunus Ceraszs L. with columnar tree habit. Acta Hort 814:325-328 Schwartz DC, Cantor CR (1984) Separation of yeast chromosome-sized DNAs by pulsed field gradient gel electrophoresis. Cell 37 (1):67-75 Schweingruber FH, Hopf M (1979) Wildäpfel und prähistorische Äpfel. Rheinland- Verlag, Seyffert W (2003) Lehrbuch der Genetik, vol 2. Spektrum, Sheng Y, Mancino V, Birren B (1995) Transformation of Escherichia coli with large DNA molecules by electroporation. Nucleic acids research 23 (11):1990-1996 Shizuya H, Birren B, Kim UJ, Mancino V, Slepak T, Tachiiri Y, Simon M (1992) Cloning and stable maintenance of 300-kilobase-pair fragments of human DNA in Escherichia coli using an F-factor-based vector. Proceedings of the National Academy of Sciences of the United States of America 89 (18):8794- 8797 Silfverberg-Dilworth E, Matasci C, Van de Weg W, Van Kaauwen M, Walser M, Kodde L, Soglio V, Gianfranceschi L, Durel C, Costa F et al. (2006) Microsatellite markers spanning the apple (Malus x domestica Borkh.) genome. Tree Genetics & Genomes 2 (4):202-224 Simpson JT, Wong K, Jackman SD, Schein JE, Jones SJM, Birol İ (2009) ABySS: A parallel assembler for short read sequence data. Genome Research 19 (6):1117-1123 Souer E, van Houwelingen A, Kloos D, Mol J, Koes R (1996) The No Apical Meristem Gene of Petunia Is Required for Pattern Formation in Embryos and 133 LITERATURVERZEICHNIS Flowers and Is Expressed at Meristem and Primordia Boundaries. Cell 85 (2):159-170 Southern EM (1975) Detection of specific sequences among DNA fragments separated by gel electrophoresis. J Mol Biol 98 (3):503-517 Sterck L, Rombauts S, Vandepoele K, Rouzé P, Van de Peer Y (2007) How many genes are there in plants (… and why are they there)? Current Opinion in Plant Biology 10 (2):199-203 Studer A, Zhao Q, Ross-Ibarra J, Doebley J (2011) Identification of a functional transposon insertion in the maize domestication gene tb1. Nat Genet 43 (11):1160-1163 Surget-Groba Y, Montoya-Burgos JI (2010) Optimization of de novo transcriptome assembly from next-generation sequencing data. Genome Research 20 (10):1432-1440 TAGI (2000) Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 408 (6814):796-815 Takeda S, Sugimoto K, Otsuki H, Hirochika H (1999) A 13-bp cis-regulatory element in the LTR promoter of the tobacco retrotransposon Tto1 is involved in responsiveness to tissue culture, wounding, methyl jasmonate and fungal elicitors. The Plant journal : for cell and molecular biology 18 (4):383-393 Tanksley SD, Ganal MW, Martin GB (1995) Chromosome landing: a paradigm for map-based gene cloning in plants with large genomes. Trends in Genetics 11 (2):63-68 Tanksley SD, Young ND, Paterson AH, Bonierbale MW (1989) RFLP Mapping in Plant Breeding: New Tools for an Old Science. Nat Biotech 7 (3):257-264 Tartarini S, Gianfranceschi L, Sansavini S, Gessler C (1999) Development of reliable PCR markers for the selection of the Vf gene conferring scab resistance in apple. Plant Breeding 118 (2):183-186 Tian Y-K, Wang C-H, Zhang J-S, James C, Dai H-Y (2005) Mapping Co, a gene controlling the columnar phenotype of apple, with molecular markers. Euphytica 145 (1):181-188 Tian YK, Wang CH, Dai HY, Zhang JS (2004) Screening of a RAPD marker tightly linked to Co gene in apple and the SCAR marker conversion. Yi chuan xue bao = Acta genetica Sinica 31 (9):919-925 Tobutt K (1985) Breeding columnar apples at East Malling. Acta Horticulturae 159:63-68 Troggio M, Gleave A, Salvi S, Chagné D, Cestaro A, Kumar S, Crowhurst RN, Gardiner SE (2012) Apple, from genome to breeding. Tree Genetics & Genomes 8 (3):509-529 Tuskan GA, Difazio S, Jansson S, Bohlmann J, Grigoriev I, Hellsten U, Putnam N, Ralph S, Rombauts S, Salamov A et al. (2006) The genome of black cottonwood, Populus trichocarpa (Torr. & Gray). Science 313 (5793):1596- 1604 Umehara Y, Inagaki A, Tanoue H, Yasukochi Y, Nagamura Y, Saji S, Otsuki Y, Fujimura T, Kurata N, Minobe Y (1995) Construction and characterization of a rice YAC library for physical mapping. Mol Breeding 1 (1):79-89 Vali U, Brandstrom M, Johansson M, Ellegren H (2008) Insertion-deletion polymorphisms (indels) as genetic markers in natural populations. BMC Genetics 9 (1):8 134 LITERATURVERZEICHNIS Van Damme M, Andel A, Huibers RP, Panstruga R, Weisbeek PJ, Van den Ackerveken G (2005) Identification of Arabidopsis Loci Required for Susceptibility to the Downy Mildew Pathogen Hyaloperonospora parasitica. Molecular Plant-Microbe Interactions 18 (6):583-592 Van Damme M, Huibers RP, Elberse J, Van den Ackerveken G (2008) Arabidopsis DMR6 encodes a putative 2OG-Fe(II) oxygenase that is defense-associated but required for susceptibility to downy mildew. The Plant Journal 54 (5):785-793 Vavilov NI (1926) Studies on the origin of cultivated plants. Trudy Byuro Prikl Bot 16:139-245 Velasco R, Zharkikh A, Affourtit J, Dhingra A, Cestaro A, Kalyanaraman A, Fontana P, Bhatnagar SK, Troggio M, Pruss D et al. (2010) The genome of the domesticated apple (Malus x domestica Borkh.). Nat Genet 42 (10):833-839 Venturi S, Dondini L, Donini P, Sansavini S (2006) Retrotransposon characterisation and fingerprinting of apple clones by S-SAP markers. Theor Appl Genet 112 (3):440-444 Vinatzer BA, Zhang HB, Sansavini S (1998) Construction and characterization of a bacterial artificial chromosome library of apple. TAG Theoretical and Applied Genetics 97 (7):1183-1190 Vitte C, Panaud O (2005) LTR retrotransposons and flowering plant genome size: emergence of the increase/decrease model. Cytogenetic and genome research 110 (1-4):91-107 Volik S, Zhao S, Chin K, Brebner JH, Herndon DR, Tao Q, Kowbel D, Huang G, Lapuk A, Kuo W-L et al. (2003) End-sequence profiling: Sequence-based analysis of aberrant genomes. Proceedings of the National Academy of Sciences 100 (13):7696-7701 Vos P, Hogers R, Bleeker M, Reijans M, Lee Tvd, Hornes M, Friters A, Pot J, Paleman J, Kuiper M et al. (1995) AFLP: a new technique for DNA fingerprinting. Nucleic acids research 23 (21):4407-4414 Watanabe M, Bessho H, Suzuki A, Komori S (2008) Seasonal Changes of IAA and Cytokinin in Shoots of Columnar Type Apple Trees. Acta Hortic 774:75-80 Watanabe M, Suzuki A, Komori S, Bessho H (2004) Comparison of Endogenous IAA and Cytokinins in Shoots of Columnar and Normal Type Apple Trees. J Japan Soc Hort Sci 73 (1):19-24 Weber JL, May PE (1989) Abundant class of human DNA polymorphisms which can be typed using the polymerase chain reaction. American journal of human genetics 44 (3):388-396 Welsh J, McClelland M (1990) Fingerprinting genomes using PCR with arbitrary primers. Nucleic acids research 18 (24):7213-7218 Wessler SR (1996) Plant retrotransposons: Turned on by stress. Current Biology 6 (8):959-961 Wicker T, Sabot F, Hua-Van A, Bennetzen JL, Capy P, Chalhoub B, Flavell A, Leroy P, Morgante M, Panaud O et al. (2007) A unified classification system for eukaryotic transposable elements. Nat Rev Genet 8 (12):973-982 Williams JGK, Kubelik AR, Livak KJ, Rafalski JA, Tingey SV (1990) DNA polymorphisms amplified by arbitrary primers are useful as genetic markers. Nucleic acids research 18 (22):6531-6535 135 LITERATURVERZEICHNIS Wing RA, Zhang H-B, Tanksley SD (1994) Map-based cloning in crop plants. Tomato as a model system: I. Genetic and physical mapping of jointless. Molecular and General Genetics MGG 242 (6):681-688 Wolters PJ, Schouten HJ, Velasco R, Si-Ammour A, Baldi P (2013) Evidence for regulation of columnar habit in apple by a putative 2OG-Fe(II) oxygenase. New Phytologist 200 (4):993-999 Woo S-S, Jiang J, Gill BS, Paterson AH, Wing RA (1994) Construction and characterization of bacterial artificial chromosome library of Sorghum bicolor. Nucleic acids research 22 (23):4922-4931 Wu K-S, Tanksley SD (1993) Abundance, polymorphism and genetic mapping of microsatellites in rice. Molecular and General Genetics MGG 241 (1):225-235 Xiong Y, Eickbush TH (1990) Origin and evolution of retroelements based upon their reverse transcriptase sequences. The EMBO journal 9 (10):3353-3362 Xu M, Li X, Korban S (2000) AFLP-Based detection of DNA methylation. Plant Mol Biol Rep 18 (4):361-368 Xu M, Song J, Cheng Z, Jiang J, Korban SS (2001) A bacterial artificial chromosome (BAC) library of Malus floribunda 821 and contig construction for positional cloning of the apple scab resistance gene Vf. Genome / National Research Council Canada = Genome / Conseil national de recherches Canada 44 (6):1104-1113 Xu Z, Wang H (2007) LTR_FINDER: an efficient tool for the prediction of full-length LTR retrotransposons. Nucleic Acids Research 35 (suppl 2):W265-W268 Yamazaki K, Okabe M, Takahashi E (1987) New broomy flowering peach cultivars. Bulletin of the Kanagawa Horticultural Experiment Station Yao J-L, Dong Y-H, Morris BAM (2001) Parthenocarpic apple fruit production conferred by transposon insertion mutations in a MADS-box transcription factor. Proceedings of the National Academy of Sciences 98 (3):1306-1311 Yu C, Zhang J, Peterson T (2011) Genome Rearrangements in Maize Induced by Alternative Transposition of Reversed Ac/Ds Termini. Genetics 188 (1):59-67 Yu J, Hu S, Wang J, Wong GK, Li S, Liu B, Deng Y, Dai L, Zhou Y, Zhang X et al. (2002) A draft sequence of the rice genome (Oryza sativa L. ssp. indica). Science 296 (5565):79-92 Yu Z-X, Li J-X, Yang C-Q, Hu W-L, Wang L-J, Chen X-Y (2012) The Jasmonate- Responsive AP2/ERF Transcription Factors AaERF1 and AaERF2 Positively Regulate Artemisinin Biosynthesis in Artemisia annua L. Molecular Plant 5 (2):353-365 Zhang H-B, Zhao X, Ding X, Paterson AH, Wing RA (1995) Preparation of megabase-size DNA from plant nuclei. The Plant Journal 7 (1):175-184 Zohary D, Hopf M (2000) Domestication of plants in the Old World. 3rd edition edn. Oxford University Press, 136 ANHANG Anhang A1 Vektorkarten Abbildung A1.1 Vektorkarten Teil I Die Grafik zeigt die Vektoren, die für die Klonierung von PCR-Produkten verwendet wurden. In A) ist die Vektorkarte des pCR®4-TOPO® Vektors der Fa. Invitrogen™ (Carlsbad, USA) abgebildet. B) und C) zeigen Vektorkarten des pGEM®-T bzw. des pGEM®-T Easy Vektors der Fa. Promega (Madison, USA). 137 ANHANG Abbildung A1.2 Vektorkarten Teil II Die Grafik zeigt die Vektorkarten der Vektoren pBeloBAC11 (A) und pUC19 (B) der Fa. NEB (Ipswich, USA). Der Vektor pBeloBAC11 wurde für die Konstruktion von BAC-DNA-Bibliotheken, der Vektor pUC19 bei der Herstellung der shotgun-Bibliotheken verwendet. 138 ANHANG A2 Sonden für das Screening von genomischen Apfel-BAC-Bibliotheken Die Sonden für das Screening der genomischen Apfel-BAC-Banken wurden in vier aufeinanderfolgenden Runden generiert. Für die ersten beiden Runden standen Transkriptomdatensätze der Apfelsorten P28 und A14 (Krost 2012) zur Verfügung. Die dritte Runde basiert auf Contigs des veröffentlichten GD-Genoms (Velasco et al. 2010). Abschließend wurden Sonden auf selbst generierte und sequenzierte „long range“ PCR- Produkte erstellt. In den folgenden vier Tabellen sind die jeweiligen Sonden aufgelistet. Tabelle A2.1 Sonden in der Zielregion für die KFH Runde I (Sondenpool I) Contig Region Sondengröße Sonde Transkriptomdaten Apfelsorte von bis (bp) 1 GJVGIEO02HFQT7 P28 18102354 18102656 303 2 GDSYFPM02CZF0X A14 18113754 18114115 362 3 GDSYFPM02DA9IW A14 18140560 18140942 383 4 GDSYFPM02DCQ1P A14 18202028 18202466 439 5 GDSYFPM02D6PQF A14 18294439 18294687 249 6 GJVGIEO02HUZG7 P28 18294750 18295075 326 7 Contig1921 A14 18308944 18309255 312 8 contig5251 P28 18420127 18420535 409 9 Contig19753 P28 18497033 18497451 419 10 Contig4278 A14 18514614 18515126 513 11 Contig10083 P28 18525098 18525503 406 12 GDSYFPM02D552Q A14 18536006 18536399 394 13 Contig9945 P28 18545869 18546134 266 14 GDSYFPM02DFS67 A14 18611803 18612115 313 Tabelle A2.2 Sonden in der Zielregion für die KFH Runde II (Sondenpool II) Region Sondengröße Sonde GD Contig von bis (bp) 15 MDC041557.8 18065865 18066190 326 16 MDC017675.49 18251945 18252272 328 17 MDC004247.204 18464761 18465155 395 18 MDC010450.949 18779415 18779917 503 19 MDC007787.391 18815994 18816349 356 20 MDC008849.307 18843567 18843963 397 21 MDC008849.307 18828005 18828161 157 22 MDC004959.260 18863056 18863193 138 23 MDC001753.378 18906442 18906597 156 24 MDC027247.53 18946350 18946533 184 139 ANHANG Tabelle A2.3 Sonden in der Zielregion für die KFH Runde III (Sondenpool III) Region Sondengröße Sonde GD Contig von bis (bp) 25 MDC018767.346 18165396 18165857 462 26 MDC020053.385 18197605 18198043 439 27 MDC020855.93 18284923 18285549 627 28 MDC018604.401 18376876 18377281 406 29 MDC018604.401 18366513 18366956 444 30 MDC010853.171 18382704 18383131 428 31 MDC002260.360 18621825 18622143 319 32 MDC038765.9 18661361 18661852 492 33 MDC004959.260 18861541 18861935 395 34 MDC004959.251 18892713 18893056 344 35 MDC001753.378 18941089 18941369 281 Tabelle A2.4 Sonden in der Zielregion für die KFH Runde IV (Sondenpool IV) „long range“ PCR- Sondengröße Sonde Produkt (bp) 36 LR R 434 37 LR T 385 38 LR T 379 39 LR V 340 40 LR X 1212 41 LR Z 1153 42 LR AE 314 140 ANHANG A3 Markeranalysen mittels QIAxcel Die Tabelle A3.1 zeigt die Belegung der 96-Well Platte mit genomischen DNAs der Einzelnachkommen einer Kreuzung zwischen P28 und A14. Tabelle A3.1 Plattenbelegung PCR und QIAxcel 1 2 3 4 5 6 A 6.5 C 6.8 C 6.10 C 6.14 C 6.19 C 6.24 C B 7.10 C 7.18 C 8.59 C 8.63 C 8.68 C 8.74 C C 7.50 C 7.60 C 7.71 C 7.77 C 7.85 C 7.89 C D 8.6 C 8.7 C 8.16 C 8.17 C 8.31 C 8.36 C E 6.7 N 6.18 N 6.20 N 6.23 N 6.25 N 6.29 N F 6.52 N 6.54 N 6.60 N 6.62 N 8.4 N 8.9 N G 6.91 N 6.95 N 6.98 N 6.101 N 6.102 N 6.103 N H 8.18 N 8.19 N 8.20 N 8.21 N 7.17 N 7.19 N 7 8 9 10 11 12 A 6.32 C 6.41 C 6.43 C 6.72 C 6.76 C 7.1 C B 7.21 C 7.25 C 7.26 C 7.28 C 7.42 C 7.43 C C 7.91 C 7.95 C 7.99 C 7.102 C 8.76 C 8.5 C D 8.44 C 8.45 C 8.46 C 8.55 C 8.58 C 8.2 C E 6.31 N 6.34 N 6.37 N 6.39 N 6.40 N 6.44 N F 8.14 N 8.15 N 6.73 N 6.74 N 6.88 N 6.90 N G 6.105 N 6.106 N 7.2 N 7.3 N 7.6 N 8.8 N H 7.31 N 7.37 N 7.87 N 7.93 N 7.98 N NK C: kolumnarer Phänotyp; N: normalwüchsiger Phänotyp; NK: Negativkontrolle In Abbildung A3.1 ist examplarisch die Grafik eines QIAxcel-Laufes gezeigt. Die vollständigen Daten befinden sich im elektronischen Anhang. Abbildung A3.1 QIAxcel-Lauf Die Abbildung zeigt einen Ausschnitt der Auftrennung der PCR-Produkte des Markers Ch03d11 mittels QIAxcel. Während sich in Spur H12 die Negativkontrolle befindet, handelt es sich in allen anderen Spuren um PCRs auf genomische DNAs von Nachkommen mit normalwüchsigem Phänotyp. Der Nachkomme in Spur H4 zeigt im Gegensatz zu den anderen Nachkommen den kolumnaren Genotyp (rot eingerahmt). Es handelt sich somit um einen „Ausreißer“. In der Spur H4 befindet sich der Nachkomme 8.20. 141 ANHANG A4 Markertests diverser Apfelsorten mittels selbst erstellter Marker 142 Abbildung A4.1 Markertests diverser Apfelsorten Die Grafik zeigt eine Zusammenstellung der gelelektrophoretisch aufgetrennten PCR-Produkte der selbst erstellten molekularen Marker I2_3_M1, K25_M1, 1C3_M2 und H1_M1 nach erfolgtem S1-Nuclease-Verdau. Als Template dienten genomische DNAs diverser Apfelsorten, wobei die Namen kolumnarer Apfelsorten fett dargestellt sind. M: 50 bp Ladder ANHANG A5 Inhaltsverzeichnis des elektronischen Anhangs Folgende Dateien befinden sich im beigefügten elektronischen Anhang:  Verwendeten Perl-Skripte:  fasta_check_iupac.pl  fasta_extract.pl  fasta_iupac_permut.pl  fasta_kmer.pl  fasta_n_stats.pl  fastq_integrity.pl  fastq_splitup.pl  qseq2fastq.pl  seq_filter.pl  seq_info.pl  Ergebnisse des QIAxcel_Laufes der Markertests  Primerliste  Liste aller Annotationen im Gesamtcontig  Gesamtcontig als gbk-Datei  Liste der Gene im Gesamtcontig  Liste der Transposons im Gesamtcontig (inklusive CENSOR-Daten)  Vorliegende Doktorarbeit im PDF-Format 143 CURRICULUM VITAE Curriculum Vitae 144 CURRICULUM VITAE 145 DANKSAGUNG Danksagung 146 EIDESSTATTLICHE ERKLÄRUNG Eidesstattliche Erklärung Hiermit erkläre ich, die vorliegende Dissertation selbstständig und ohne fremde Hilfe angefertigt zu haben. Weiterhin versichere ich, örtlich übernommene Ausführungen anderer Autoren und an Gedankengänge Anderer anlehnende eigene Formulierungen entsprechend gekennzeichnet und die Quellen zitiert zu haben. ---------------------------------------- ---------------------------------------- (Ort, Datum) (Dominik Otto) 147