;ID HELITRONY2 DNA ; ATH ; 11114 BP ;XX ;DE HELITRONY2 is a non-autonomous DNA transposon, a consensus sequence. ;XX ;AC . ;XX ;DT 29-AUG-2000 (Rel. 5.8, Created) ;DT 24-MAY-2001 (Rel. 6.2, Last updated, Version 2) ;XX ;KW Non-autonomous DNA transposon; replication protein A; HELITRON ;KW class; HELITRON2, HELITRONY2. ;XX ;OS consensus ;XX ;OC Arabidopsis thaliana ;OC Eukaryota; Plantae; Embryobionta; Magnoliophyta; Magnoliopsida; ;OC Dilleniidae; Capparales; Brassicaceae. ;XX ;RN [1] (bases 1 to 11116) ;RA Kapitonov,V.V. and Jurka,J. ;RL Direct submission (August 2000) ;XX ;RN [2] (bases 1 to 11114) ;RA Kapitonov,V.V. and Jurka,J. ;RL Update (May 2001) ;XX ;RN [3] ;RA Kapitonov,V.V. and Jurka,J. ;RT Rolling-circle transposons in eukaryotes. ;RL Proc Natl Acad Sci USA 98(15), 8714-8719 (2001) ;XX ;CC HELITRONY2 is a non-autonomous HELITRON-like DNA transposon. ;CC There are ~10 copies of HELITRONY2 in the genome; they are ~97% ;CC identical to the consensus sequence. ;CC HELITRONY2 transposes precisely in the AT target sites, without ;CC duplication of the host DNA. ;CC HELITRONY2 carries four genes that encode proteins ATRPA1HY1p, ;CC ATRPA1HY2p, ATRPA1HY3p and ATRPA1HY4p, respectively. ;CC ATRPA1HY1p is 518 aa long and is encoded by 10 exons (position ;CC 1057-3521), it is similar to the large subunit of RPA1, the ;CC replication protein A: ;CC MMLANPLPFTPLKSLKPYKNAWRIQVKLLHVWRQYSVKAGESIEMILVDKAGDKMYAAVR ;CC REQIKKFERCLTEGVWKIITTITLNPTSGQYRISDLKYKIGFVFKTTVSPCDTVSDALFL ;CC SLAKFDVILSGSANSNILHDVMGQVVDRSEIQDLNANNKPTKKIDFHLRDQHDTRLACTL ;CC WGKYAEIVDKACQESTDGIVVCLIRFAKINLYNDTRSVSNSFDVSQVFVDPTLAELGLFK ;CC QSIPTDGLTLGSSGSFHKRLYAPRTGDDDGDYPRQTIKEVLTSSDVGKCKTVCTVSAIDT ;CC DWPWYYFCCRAHNKKVVKEEAIKLEDVKQPQKPRFWCEICNGFAKSVVAKFWLHLHIMDQ ;CC TGEARCMLFDSHAKEILGTTAPQLLDGSFDEIEDPTVLPDVINGLKGKTFQFLLCIQREN ;CC IFGGYDSFTVARVYTGNIVDEIVQEDSDAYVDPSSLISIEQGSLMLTNGVDLSDVDLSST ;CC STPSSKRKDSDDVDGNDQASTSRKKCSRMTMSEERSGE ;CC ATRPA1HY2p is 195 aa long and is encoded by 4 exons (position ;CC 4254-4388), it is similar to the ssDNA-binding portion of the ;CC large subunit of RPA1: ;CC MSVHKLTDLRDNSTNWKINVKILSIWNHPPNSHGEITTMILHDDKNNRVDATIPQGNYHN ;CC PFRPFLKPGTWIHISDFRVVVPQSRVRYSSFRFHIKFIWETSVYPLPELVKRDFFDFIFP ;CC IDLKYPCLEDWDYVTDAMGVVTNISAIKKFLFVCRQGETDYESRYVSFELLDNIRGFEDY ;CC DELPKNPRMEVIEEN ;CC ATRPA1HY3p is 218 aa long and is encoded by 5 exons (position ;CC 7087-8177), it is similar to the ssDNA-binding portion of the ;CC large subunit of RPA1: ;CC MIDAICAYFYTGYDVPRVLNEGGWFFLENILLIKSVGGRKPPLTDNKLRIKFLQTTKMTP ;CC VPNREPSNFFRFAAFSMIENKTINSSTVHDAYGIVVRVGNITRPDFVPQASENTILSQFL ;CC EFEIKNSCGYTCELFVQLWRGLGLELGYHWNFGMNPTICVLRFWNVDDHEGRQCLISHNG ;CC ASRITFNQSYPEINMDRVRTQFLQRMQTPELDEVVDEN ;CC ATRPA1HY4p is 215 aa long and is encoded by 5 exons (position ;CC 9277-10327), it is similar to the ssDNA-binding portion of the ;CC large subunit of RPA1: ;CC MGLILADEHGMTIEATVGYKMSDHYKDFINEGEWVTITNFGVVENSGSVRATTHSFKIGF ;CC SVDTVVRLTSPVPAIPHYRLASFSSIIDDEIDKSVLVDLVGAIYDVGELINTRPKQNNVD ;CC DLTLTFKISDNENRVLECLATKKEALDFDHNYRRYGGGVIVAVLGWWKIDRYFDGPKNVR ;CC VCTAGPISTVFPDPDIPESNEIHEMLRDEGARNGG ;CC There is 95% nucleotide identity between ~4200-bp 5'-terminal ;CC portions of HELITRONY2 and HELITRON1; their ~360-bp 3'-termini ;CC are 87% identical with each other. ;XX ;DR [2] (Consensus) ;XX ;SQ Sequence 11114 BP; 3487 A; 1694 C; 1637 G; 4296 T; 0 other; HELITRONY2 tctacactattatttgagacgtacgttaagtgattctcagttaaaacaaaaaaattaccttaaaatcata tgtttaaaatgttaatgtcatggaaaaatttacctttaactgagaatcacttaacttacgttataatctt ggccattcgattgaattatttgtgtctgttcgatctctcgccttcacttaaaaaacacgcggatcctttt gacccggatttacaatttttgggtcatacgttataatcttggccattcgattgaagtgtttgtgtccgtt cgatctctcgccttcacttaaaaaacacgcggatctttttgaccctggtttacaacttttgggttatgcg ttataatcttggtcattcaattgaattgtttttatccgttcgatttcgtattttccaaaaaaatacacgt gcattttttattaataaaacaaaaaatggaattctccttttaatcctggccgttgaatagatttatttca agtcgtccgattttgtagtttcatgcataaattcatccgactctatttcaggaaactaatcgtattaatt tcattaaatatttggcgtatcttcgtggatgacgatgaaacagtatttcgtatggatcttctttgagaat tatcttacattttctccataattatagcacatataatatttcgtttggatcttctttttgaattatctta cattttctccataattatagcacatctaatatttctttgcgatcttcttttggaattattttacatttct ccataattctaacatatctaatatttcgtttcaattctcttttgcacttatcttacatttttttcaagta ttccctatattcatacctacttttatggaaatgataaatattttcctataatcatcggattttttatatc gaataaacttgaattccaaggataatatcttttgcgcatgtttttttgaccaaactgctcattcttataa atatcggacgcctcatttcaatctactcactcagcttacactcacacagtttcatttccaaattcatttt taaaaatgatgctcgccaatcctcttccattcactcccttgaaatcgctaaaaccttacaagaacgcttg gcgtattcaggttaaattgcttcatgtttggaggcaatattctgtaaaggctggtgaatccatcgaaatg attttggttgataaagctgtacgtattatagtttcaactttatgttttcgtaaaccttatagtgtgttca agcatcattttcttttactaattattatttaaattatttttgtcatatagggtgataagatgtatgctgc tgtgagaagagagcagatcaagaagtttgaaaggtgcttaaccgagggtgtttggaagatcattacgaca atcactctaaatcctacaagtggccagtatcgtatttctgacttgaaatacaagattggttttgttttca aaaccacggtctctccatgtgataccgtttctgatgctttgttcctctcacttgctaagtttgatgtgat cctctctggatccgctaactcaaatatcttgcacggttagattcaagttttcattttattttagaacata catgcattatctcttatgtagtcattatattcatagatttattgtatttgtctatacagatgttatgggt caggttgtcgatcggtctgaaatccaagatcttaacgctaacaacaagcccaccaaaaaaatcgatttcc atttgagagatcagcagtacaaacaatctatattcatattcattcttatttaaagtttattttttttact ttttattaataaatttattctttccatttttagtgacactcgcttggcatgtacactttgggggaagtat gctgagattgttgacaaagcttgccaggagtcaaccgatggtattgttgtttgcttaatccgatttgcga agatcaatctctacaacggtaattatattgttatgtgttactacatatctatactattttaaaaacacga tcttatatttttaaaacagatactaggagtgtttccaattcttttgatgtttcacaagtcttcgtggatc ccacgttggctgagttgggtctttttaagcaaaggtaattgtatttatttgtcactaaatatatttgttt atacataatattaagcaaactatattttcttgatatatagcataccaactgatgggttaactttgggaag ttctggatcttttcacaagaggctctatgcaccaagaactggggatgacgatggtgattatccaaggcaa acaatcaaggaagtcctcacatcttctgatgtactattcattaatttatttatcctactaacatttttat tacatttttatatttttagcttagtttgttaattcctctttatattcatttgaaggtgggtaagtgcaaa acagtttgcactgtttcggcaattgatacagattggccgtggtactatttttgttgtcgtgctcacaaca agaaggttgtcaaagaagaagctatcaaacttgaagatgtcaagcaacctcaaaagccaagattttggtg tgaaatatgcaatggttttgcaaaatctgttgttgccaagttagtctttatgaaatctttatattgaatg tattattaattataatttggtgtttagaagctaataatcctatttaacttttaggttttggctacatctc catattatggaccaaaccggtgaagctagatgcatgttattcgatagtcatgcaaaggaaattcttggca ctactgcccctcaattgcttgatgggtcatttgatgaggtataatgcctttttaaaaataaactctttca ttaaaatgaccacgttcatgttataataatctgtattttctgtagatcgaagatccaactgttttgcctg atgtgatcaatggtttgaaaggcaagacttttcagtttctattgtgcattcaaagggaaaacatatttgg tggatatgattcattcactgttgcccgagtctacaccggtaacattgtcgatgaaatcgttcaagaagac tctgatgcatacgttgatccatcatccttaatttcgatcgaacaggtttgacaaataacattaaactatt ccaattatttctcaaaattttttagggttgtcttattaaaatgtttttgtattttcatatagggttccct tatgctcactaatggtgttgacctttctgatgtcgatttgtcgtcaacctctactccatcatcaaaacga aaagattcagatgatgttgatggaaatgatcaggcttccacaagtaggaagaagtgttctaggatgacca tgtctgaggaacgctccggcgaatgatgctcaatgactactccagctttgatcgttttcttctttcttat ttatttgcttaaagttatcagagttgttttattttttaagatctaaactatctttattttatttgtggaa tttttttgggaattaataaagttatttcaattatatgtcgttttgttttgttaaatctaaatttttggaa tacacagagctgagatttgattactctcttagtttcaccaaatattatgttgtagaattttgacacaaag taagaataacaacttttcattaaatattattattttgttagtttaactatagtattagttatatttctct cttcttttattggttaacaataaaaatagtaatgatgttgttgtacaacatcaatcttgatgaaagaaga aaaaaactcaaaacatcaatttttcagaaaaaaaatctacactattattaagaaacacatcatttggttt ttataatgttaatcatactaataactataaacaattttttaattttgtattaaatattctacaaaatcaa aaatagcaaagattttgtacactaaataatccgtcttattaaatatgattaatcatgataactcaaacaa aacaacctatttctattttttcatagattctcattttattaattataatatttagtaacacgctaagaaa taaatgtcatcattattgttctaacctataagaaatcctattggttctagacgattcgtttcctttttac acttcaacttttcatcattgtatcttttcccaattatataaaatcaaaaacctcaagtctagaacaatta ggtttaactctttatctttctaaacaaaaaaaaacttccttcgatacacaagatgtctgttcataaactc accgatttgagggataactcaacaaactggaagattaacgtcaagatcctatcaatttggaatcatcctc caaacagtcatggtgaaattacgaccatgattcttcatgatgacaaggtttgtattttcacttttttttc ttttaatcccaatttactttgttattattgaaacagatcatcacaaactatttaatctttgagttgtttg gactttttcagaataaccgtgttgatgcaacaattcctcaaggaaactatcacaatcccttccgtccgtt tctcaagcctggcacatggattcacatctctgactttcgggtcgttgttcctcaatcaagggttaggtat tcgtcctttcgttttcacatcaaattcatttgggaaacaagtgtttaccctctcccggaacttgtgaaaa gagacttctttgacttcatttttcccattgaccttaagtatccatgtcttgaggattgggattatgtcac gggtaagtttttagtcaatctatgttcttctcattttaagaattaatttatgatagtaatttatgttatt atttttgaaatatggtattaatatattattctatacttagatgcaatgggtgtggtgacaaatatctcgg ctattaagaaatttctatttgtttgtcgccaaggtgaaaccgactatgaatcaagatatgtctcattcga acttttggacaatatgtaagttgtagtgtttttaagtatgtttagtaatgcaatgcttagtttaatatta gcttaataatgtgtgagtagatgtgtcacctgtctgaaaaattagcttaataatgcattgcttagtctaa tattttatcatattggttaggggagagaaaatgaaatgctatgctgttggaagatgctgtgaactttttg ttacaaatttctcaaaatgtatcagttcagccgcttataactatcagcccattgttgccattgtgagatt ttggagaattgctgagattgagggttagttatttttgtttctattgtaattctatttacttatgattatt atttgtattatataattttaaatgaaactaatggaacaggtgagaatgttttgaagagtgaatttggatg ttcaagaatttacctcaatccaaccaatttccctgagatagatattcaaagctacatgtaagaattttat cacttttttattgtattcgttaaccaaaacatcaattaatcaataccgatttttgttttttctcttttac agccgcggtttcgaagattatgatgaacttccaaagaacccaaggatggaagtgattgaagagaattagg agtttgacctcccatctcctattcttatttaaattatgtttcgaacttattttaatttcctgcaaacttt gtcattgtatgttattttttattataaaaaatatgcttatgctttgaacttatttaagtaatgtattccc tttttattttcatatatcttatgttttgttaaactcctaacaaagtttacaagtataacataaaaatcta caaacaaactcatatataaatttgcaacgattacatataaatacagttgtagaattttttatttctttaa aaaaatactatccttttaatttattttatttcacatatcattatttatgattcttttcaaaaggaaatta aaaaattattgggtatcaagaataaaacattaaaaactttgagataaatcattcttggaaacatcaggat catttattattaagttcatttcttttcaactcatgtcattgtcttatacaaaaagtaatcttaaatattt ggactctttatatttataaccctacaaaagcattatctttcagtatcatgtctctcatattaaaataata ttgattttgaaaacctaggtactccttttaaagtttctttttggatatagatgaaagtcacatcattacc tttgtgacttaaaaataatcgatacatatataacagttagaatttaatttctaaggaatgtaatatatat atatatatatatatatatcagtttattctaaatatattttgctctcatacatattttctggaataataaa gtagattttattgagtagatacaaatattaacatctatattctcttcaatctatttatgagacttgcttt ctcaattaaatctattgttcacatcttttctttccatcttttccaagattgataacaagattagacaact catccaagagatatgacaacttatgtcacattttgtttcttacaaaatttattaaaattcgcaagtaacc ataaaaagcactataatttaccatcgagattccaaattcgattgacaagatttgcatggcatttaacttt ttctatttaatatacaagtaatattcttttgggcaaaaaaaaaaaatacaagtaatattcctaaactgtc aaaggacacataacctgaaaaaaggtaacctcccctcttattttcatccattacttatcttcgacatctt tcttctaccctattagtttcaaaaaaaaaaaagatgttgagagatgatagaggtggttattttaaaggta tctcatatctatctcaactttctcaaaaaaaaaagattggaaggtttttgtgaagctactatgttggtgg gtaacacttcctcatgagggtgggaagtgttaccaaatgatcttgtgcgacgagatggtaatttgttttt tgatctaatctattaataatttaatagtattccttggatctaatctattaataattcataagtcaatttt tttttttagggcacaatgattgatgccatttgtgcttatttctacactggatatgacgtccctagagttc tcaatgaaggaggttggtttttcttggaaaacatacttctgatcaaatcagtcggcggtagaaaacctcc cttaactgataataagttgagaatcaagttccttcagactaccaaaatgactcctgtgcctaatagagaa ccaagtaactttttccgatttgctgccttctctatgatcgaaaacaagactattaattcttcaactgttc atggtaactttcttatttagatttttcactaatataaagtctatttttttgaaaatattaatctttcata ttatcgttttttttgtttgtagatgcttatggtattgtcgtgagagttgggaatataacaagaccggact ttgtccctcaagcttcagaaaatactatactttctcaatttctcgaatttgagattaaaaattcttggtt agtattttccactatatagttcgtcatctatttggttatatatttgaatgcacaaacatagtaaatattg ttatctttatagttggtttaattcatagaacttagatgttttggtggaataatttgatattgttattagg ggtaaatctctcatatgtgttgcaagcggatatacttgtgagttgtttgtgcaattatggaggggacttg gtctagaacttggttatcactggaactttggtatgaatcctacaatctgtgtgctacgattttggaatgt tgatgatcatgaaggtatatttaagactcattttatgttatctataatttatatagctacttcatataat aaaaacgttaatattttaggtcgtcaatgtctaatctcacataatggtgcttcaagaattacattcaatc aaagttacccagagattaacatggatcgcgtcaggtaagaacgtttatatttacattatcccttaactgt ttattgtattttttaaaattttggtcttggttatttttaatttttctattttcctactgtttcagaactc aattccttcaacgaatgcaaacacctgagctagatgaagttgtggacgagaactgaaaatgcaacaccag acccctatctatcgttttgtttaaaaacttatctacatatgttttaaagttgtacttttaaagactttgt ttatttttttattgactttcttatgattatttctgttaaactttaactttattataactccttttattta atgcttactaaataactatataaccgtaaacttagatcaaattataactgcttttagattggccaattat taggttattttgatttaaataatgttgatattttattgattttaataaaatgtatttggattgcaaattt tgattacaatgtaatctaaaatatgagttagatatctacactattaaacaaagaaaaataaaaaccaaac cttagagtttattagaagatttgtccaaagaaatatgtcgttaaaatcaacatcgttagagaatcttcta agttgaaaacatttattatttcaactcttatatataagtgccataatagaattaaattatagattctgtt gttaacaatatatttgcatatatattgtttcctaatttttaatcacttccattattaaaaatattttaaa attttgttacttatttctctccattattattaacttttatggaaattttgttattatatgtctcaaacat tataggatcctgtgattattagtaatttatccacgcagttaagacaattggtatttatataagaactcca attaataataaggatacaatatttatattatttcctaaaatataagactcgccaaatttttaattttatt aataattgatttattcaaaatatattacagaatcttcaagattacgaagtgacttgaaacgtcatgactg ttattactttttaaaaaagttgcgtctaaaacatgcctctacggtgtatttgtctcttatatatatatat atcggtatcattagcatctcataaaacgaatacaaaaaaataactaagaaatttctgccaaaagatggaa tcgtttcatcctctttcactgttgaaaccgtctattagaggatggtgtattcgtgggagagttgtgagga cattcttagtttcgctggttccatcttcaaaggttatgggtttgattctcgccgacgaacatgtaagtat tgactgttttgtaatgataattctaggtttgcatgttttagaattttgattagtatgtttgatccgtagg gtatgactattgaagctactgttgggtataagatgtcggatcactataaagattttattaatgaaggaga atgggtaacgataacaaattttggagttgttgagaactcgggttctgtcagggcaacaactcatagcttc aaaattggattttctgttgacactgtcgtcagattaacaagtccggtacccgctattcctcactatcgtc tagcatccttctcttcgattattgatgatgaaatcgataaatctgttttagtcggtgagatttttatgaa tttgttgtgttccttattttatatcatgcatcttagtgttcattagttttgtcattttcaatatcaattg tatatatttgactctgatttattttaattaatttatgtaattttttggagacttggtgggagcgatctat gatgttggagaattgattaacacaagacctaagcaaaacaacgtcgatgatttgacgctaacattcaaaa taagtgacaatgagtaagtttccttctttgatagtttaattcgaattacctaaattatactattctaata atatttttgattttatgtttagaaaccgtgttttggaatgtctagctactaagaaggaagctcttgactt tgatcataattatcgtcgatatggtggtggagttattgtcgctgttcttggttggtggaagattgaccgt tattttgatggtccaaagaacgtacgtgtttgcaccgcaggcccgatatcaaccgtctttccggatcctg atattcccgagtctaacgagatccatgagatgtaagttttgatctatcatcaaatattcttacatttcgt tattagtaattatataaacggaatatctatactattatttataattgcataccacatttgtttgttttgt aggctccgtgatgaaggtgcaaggaatggcggttgaacatctacttaaaaaatgtttttacatgtagcct attgaactcggtctattattatttttatttctgtatgaacaagtttccatttttatttctgtatgaacaa gtttacatatttcgaatttagaataccttctaaaacttgatatcttacaatatcgcatcgctattattga caaaatttaatatgattcatcctaaaataaatcttagaaggtatgacaaaatttaatatcaaagattatt gctttttttttaaacatcttaatattgctttatatatctaattctaatatttatttattcgtctgtctct atcagaattgcaaaatttagaaaaatatatttattattgctttggcttatgtctcatataacataattat tttatcaacaaatgttagtttcacattctgtaaatataaacatatataaaattagaaattttctgattat gagatactgttaaacttctataacacttacatacacgaaaatgtacaaagctactatgtgtaaacctaca tatacaaaatataaaattacgttcccaaacgtacatatcaacttagacattgtttccatgctacaacccg aggaaactatatatacttaccaaaatattgtttgacgagactaaatatatttattttattccaatgatac atgatatacaactatatgtttacatataatgaaaataaagtagagtttatgtggaatacacagaacttat atttgatgattgatttaaccaaagataccgtgcgtagcacgggtactgacctag1