;ID   HELITRONY2  DNA   ; ATH   ; 11114 BP
;XX
;DE   HELITRONY2 is a non-autonomous DNA transposon, a consensus sequence.
;XX
;AC   .
;XX
;DT   29-AUG-2000 (Rel. 5.8, Created)
;DT   24-MAY-2001 (Rel. 6.2, Last updated, Version 2)
;XX
;KW   Non-autonomous DNA transposon; replication protein A; HELITRON
;KW   class; HELITRON2, HELITRONY2.
;XX
;OS   consensus
;XX
;OC   Arabidopsis thaliana
;OC   Eukaryota; Plantae; Embryobionta; Magnoliophyta; Magnoliopsida;
;OC   Dilleniidae; Capparales; Brassicaceae.
;XX
;RN   [1]  (bases 1 to 11116)
;RA   Kapitonov,V.V. and Jurka,J.
;RL   Direct submission (August 2000)
;XX
;RN   [2]  (bases 1 to 11114)
;RA   Kapitonov,V.V. and Jurka,J.
;RL   Update (May 2001)
;XX
;RN   [3]
;RA   Kapitonov,V.V. and Jurka,J.
;RT   Rolling-circle transposons in eukaryotes.
;RL   Proc Natl Acad Sci USA 98(15), 8714-8719 (2001)
;XX
;CC   HELITRONY2 is a non-autonomous HELITRON-like DNA transposon.
;CC   There are ~10 copies of HELITRONY2 in the genome; they are ~97%
;CC   identical to the consensus sequence.
;CC   HELITRONY2 transposes precisely in the AT target sites, without
;CC   duplication of the host DNA.
;CC   HELITRONY2 carries four genes that encode proteins ATRPA1HY1p,
;CC   ATRPA1HY2p, ATRPA1HY3p and ATRPA1HY4p, respectively.
;CC   ATRPA1HY1p is 518 aa long and is encoded by 10 exons (position
;CC   1057-3521), it is similar to the large subunit of RPA1, the
;CC   replication protein A:
;CC   MMLANPLPFTPLKSLKPYKNAWRIQVKLLHVWRQYSVKAGESIEMILVDKAGDKMYAAVR
;CC   REQIKKFERCLTEGVWKIITTITLNPTSGQYRISDLKYKIGFVFKTTVSPCDTVSDALFL
;CC   SLAKFDVILSGSANSNILHDVMGQVVDRSEIQDLNANNKPTKKIDFHLRDQHDTRLACTL
;CC   WGKYAEIVDKACQESTDGIVVCLIRFAKINLYNDTRSVSNSFDVSQVFVDPTLAELGLFK
;CC   QSIPTDGLTLGSSGSFHKRLYAPRTGDDDGDYPRQTIKEVLTSSDVGKCKTVCTVSAIDT
;CC   DWPWYYFCCRAHNKKVVKEEAIKLEDVKQPQKPRFWCEICNGFAKSVVAKFWLHLHIMDQ
;CC   TGEARCMLFDSHAKEILGTTAPQLLDGSFDEIEDPTVLPDVINGLKGKTFQFLLCIQREN
;CC   IFGGYDSFTVARVYTGNIVDEIVQEDSDAYVDPSSLISIEQGSLMLTNGVDLSDVDLSST
;CC   STPSSKRKDSDDVDGNDQASTSRKKCSRMTMSEERSGE
;CC   ATRPA1HY2p is 195 aa long and is encoded by 4 exons (position
;CC   4254-4388), it is similar to the ssDNA-binding portion of the
;CC   large subunit of RPA1:
;CC   MSVHKLTDLRDNSTNWKINVKILSIWNHPPNSHGEITTMILHDDKNNRVDATIPQGNYHN
;CC   PFRPFLKPGTWIHISDFRVVVPQSRVRYSSFRFHIKFIWETSVYPLPELVKRDFFDFIFP
;CC   IDLKYPCLEDWDYVTDAMGVVTNISAIKKFLFVCRQGETDYESRYVSFELLDNIRGFEDY
;CC   DELPKNPRMEVIEEN
;CC   ATRPA1HY3p is 218 aa long and is encoded by 5 exons (position
;CC   7087-8177), it is similar to the ssDNA-binding portion of the
;CC   large subunit of RPA1:
;CC   MIDAICAYFYTGYDVPRVLNEGGWFFLENILLIKSVGGRKPPLTDNKLRIKFLQTTKMTP
;CC   VPNREPSNFFRFAAFSMIENKTINSSTVHDAYGIVVRVGNITRPDFVPQASENTILSQFL
;CC   EFEIKNSCGYTCELFVQLWRGLGLELGYHWNFGMNPTICVLRFWNVDDHEGRQCLISHNG
;CC   ASRITFNQSYPEINMDRVRTQFLQRMQTPELDEVVDEN
;CC   ATRPA1HY4p is 215 aa long and is encoded by 5 exons (position
;CC   9277-10327), it is similar to the ssDNA-binding portion of the
;CC   large subunit of RPA1:
;CC   MGLILADEHGMTIEATVGYKMSDHYKDFINEGEWVTITNFGVVENSGSVRATTHSFKIGF
;CC   SVDTVVRLTSPVPAIPHYRLASFSSIIDDEIDKSVLVDLVGAIYDVGELINTRPKQNNVD
;CC   DLTLTFKISDNENRVLECLATKKEALDFDHNYRRYGGGVIVAVLGWWKIDRYFDGPKNVR
;CC   VCTAGPISTVFPDPDIPESNEIHEMLRDEGARNGG
;CC   There is 95% nucleotide identity between ~4200-bp 5'-terminal
;CC   portions of HELITRONY2 and HELITRON1; their ~360-bp 3'-termini
;CC   are 87% identical with each other.
;XX
;DR   [2] (Consensus)
;XX
;SQ   Sequence 11114 BP; 3487 A; 1694 C; 1637 G; 4296 T; 0 other;
HELITRONY2
tctacactattatttgagacgtacgttaagtgattctcagttaaaacaaaaaaattaccttaaaatcata
tgtttaaaatgttaatgtcatggaaaaatttacctttaactgagaatcacttaacttacgttataatctt
ggccattcgattgaattatttgtgtctgttcgatctctcgccttcacttaaaaaacacgcggatcctttt
gacccggatttacaatttttgggtcatacgttataatcttggccattcgattgaagtgtttgtgtccgtt
cgatctctcgccttcacttaaaaaacacgcggatctttttgaccctggtttacaacttttgggttatgcg
ttataatcttggtcattcaattgaattgtttttatccgttcgatttcgtattttccaaaaaaatacacgt
gcattttttattaataaaacaaaaaatggaattctccttttaatcctggccgttgaatagatttatttca
agtcgtccgattttgtagtttcatgcataaattcatccgactctatttcaggaaactaatcgtattaatt
tcattaaatatttggcgtatcttcgtggatgacgatgaaacagtatttcgtatggatcttctttgagaat
tatcttacattttctccataattatagcacatataatatttcgtttggatcttctttttgaattatctta
cattttctccataattatagcacatctaatatttctttgcgatcttcttttggaattattttacatttct
ccataattctaacatatctaatatttcgtttcaattctcttttgcacttatcttacatttttttcaagta
ttccctatattcatacctacttttatggaaatgataaatattttcctataatcatcggattttttatatc
gaataaacttgaattccaaggataatatcttttgcgcatgtttttttgaccaaactgctcattcttataa
atatcggacgcctcatttcaatctactcactcagcttacactcacacagtttcatttccaaattcatttt
taaaaatgatgctcgccaatcctcttccattcactcccttgaaatcgctaaaaccttacaagaacgcttg
gcgtattcaggttaaattgcttcatgtttggaggcaatattctgtaaaggctggtgaatccatcgaaatg
attttggttgataaagctgtacgtattatagtttcaactttatgttttcgtaaaccttatagtgtgttca
agcatcattttcttttactaattattatttaaattatttttgtcatatagggtgataagatgtatgctgc
tgtgagaagagagcagatcaagaagtttgaaaggtgcttaaccgagggtgtttggaagatcattacgaca
atcactctaaatcctacaagtggccagtatcgtatttctgacttgaaatacaagattggttttgttttca
aaaccacggtctctccatgtgataccgtttctgatgctttgttcctctcacttgctaagtttgatgtgat
cctctctggatccgctaactcaaatatcttgcacggttagattcaagttttcattttattttagaacata
catgcattatctcttatgtagtcattatattcatagatttattgtatttgtctatacagatgttatgggt
caggttgtcgatcggtctgaaatccaagatcttaacgctaacaacaagcccaccaaaaaaatcgatttcc
atttgagagatcagcagtacaaacaatctatattcatattcattcttatttaaagtttattttttttact
ttttattaataaatttattctttccatttttagtgacactcgcttggcatgtacactttgggggaagtat
gctgagattgttgacaaagcttgccaggagtcaaccgatggtattgttgtttgcttaatccgatttgcga
agatcaatctctacaacggtaattatattgttatgtgttactacatatctatactattttaaaaacacga
tcttatatttttaaaacagatactaggagtgtttccaattcttttgatgtttcacaagtcttcgtggatc
ccacgttggctgagttgggtctttttaagcaaaggtaattgtatttatttgtcactaaatatatttgttt
atacataatattaagcaaactatattttcttgatatatagcataccaactgatgggttaactttgggaag
ttctggatcttttcacaagaggctctatgcaccaagaactggggatgacgatggtgattatccaaggcaa
acaatcaaggaagtcctcacatcttctgatgtactattcattaatttatttatcctactaacatttttat
tacatttttatatttttagcttagtttgttaattcctctttatattcatttgaaggtgggtaagtgcaaa
acagtttgcactgtttcggcaattgatacagattggccgtggtactatttttgttgtcgtgctcacaaca
agaaggttgtcaaagaagaagctatcaaacttgaagatgtcaagcaacctcaaaagccaagattttggtg
tgaaatatgcaatggttttgcaaaatctgttgttgccaagttagtctttatgaaatctttatattgaatg
tattattaattataatttggtgtttagaagctaataatcctatttaacttttaggttttggctacatctc
catattatggaccaaaccggtgaagctagatgcatgttattcgatagtcatgcaaaggaaattcttggca
ctactgcccctcaattgcttgatgggtcatttgatgaggtataatgcctttttaaaaataaactctttca
ttaaaatgaccacgttcatgttataataatctgtattttctgtagatcgaagatccaactgttttgcctg
atgtgatcaatggtttgaaaggcaagacttttcagtttctattgtgcattcaaagggaaaacatatttgg
tggatatgattcattcactgttgcccgagtctacaccggtaacattgtcgatgaaatcgttcaagaagac
tctgatgcatacgttgatccatcatccttaatttcgatcgaacaggtttgacaaataacattaaactatt
ccaattatttctcaaaattttttagggttgtcttattaaaatgtttttgtattttcatatagggttccct
tatgctcactaatggtgttgacctttctgatgtcgatttgtcgtcaacctctactccatcatcaaaacga
aaagattcagatgatgttgatggaaatgatcaggcttccacaagtaggaagaagtgttctaggatgacca
tgtctgaggaacgctccggcgaatgatgctcaatgactactccagctttgatcgttttcttctttcttat
ttatttgcttaaagttatcagagttgttttattttttaagatctaaactatctttattttatttgtggaa
tttttttgggaattaataaagttatttcaattatatgtcgttttgttttgttaaatctaaatttttggaa
tacacagagctgagatttgattactctcttagtttcaccaaatattatgttgtagaattttgacacaaag
taagaataacaacttttcattaaatattattattttgttagtttaactatagtattagttatatttctct
cttcttttattggttaacaataaaaatagtaatgatgttgttgtacaacatcaatcttgatgaaagaaga
aaaaaactcaaaacatcaatttttcagaaaaaaaatctacactattattaagaaacacatcatttggttt
ttataatgttaatcatactaataactataaacaattttttaattttgtattaaatattctacaaaatcaa
aaatagcaaagattttgtacactaaataatccgtcttattaaatatgattaatcatgataactcaaacaa
aacaacctatttctattttttcatagattctcattttattaattataatatttagtaacacgctaagaaa
taaatgtcatcattattgttctaacctataagaaatcctattggttctagacgattcgtttcctttttac
acttcaacttttcatcattgtatcttttcccaattatataaaatcaaaaacctcaagtctagaacaatta
ggtttaactctttatctttctaaacaaaaaaaaacttccttcgatacacaagatgtctgttcataaactc
accgatttgagggataactcaacaaactggaagattaacgtcaagatcctatcaatttggaatcatcctc
caaacagtcatggtgaaattacgaccatgattcttcatgatgacaaggtttgtattttcacttttttttc
ttttaatcccaatttactttgttattattgaaacagatcatcacaaactatttaatctttgagttgtttg
gactttttcagaataaccgtgttgatgcaacaattcctcaaggaaactatcacaatcccttccgtccgtt
tctcaagcctggcacatggattcacatctctgactttcgggtcgttgttcctcaatcaagggttaggtat
tcgtcctttcgttttcacatcaaattcatttgggaaacaagtgtttaccctctcccggaacttgtgaaaa
gagacttctttgacttcatttttcccattgaccttaagtatccatgtcttgaggattgggattatgtcac
gggtaagtttttagtcaatctatgttcttctcattttaagaattaatttatgatagtaatttatgttatt
atttttgaaatatggtattaatatattattctatacttagatgcaatgggtgtggtgacaaatatctcgg
ctattaagaaatttctatttgtttgtcgccaaggtgaaaccgactatgaatcaagatatgtctcattcga
acttttggacaatatgtaagttgtagtgtttttaagtatgtttagtaatgcaatgcttagtttaatatta
gcttaataatgtgtgagtagatgtgtcacctgtctgaaaaattagcttaataatgcattgcttagtctaa
tattttatcatattggttaggggagagaaaatgaaatgctatgctgttggaagatgctgtgaactttttg
ttacaaatttctcaaaatgtatcagttcagccgcttataactatcagcccattgttgccattgtgagatt
ttggagaattgctgagattgagggttagttatttttgtttctattgtaattctatttacttatgattatt
atttgtattatataattttaaatgaaactaatggaacaggtgagaatgttttgaagagtgaatttggatg
ttcaagaatttacctcaatccaaccaatttccctgagatagatattcaaagctacatgtaagaattttat
cacttttttattgtattcgttaaccaaaacatcaattaatcaataccgatttttgttttttctcttttac
agccgcggtttcgaagattatgatgaacttccaaagaacccaaggatggaagtgattgaagagaattagg
agtttgacctcccatctcctattcttatttaaattatgtttcgaacttattttaatttcctgcaaacttt
gtcattgtatgttattttttattataaaaaatatgcttatgctttgaacttatttaagtaatgtattccc
tttttattttcatatatcttatgttttgttaaactcctaacaaagtttacaagtataacataaaaatcta
caaacaaactcatatataaatttgcaacgattacatataaatacagttgtagaattttttatttctttaa
aaaaatactatccttttaatttattttatttcacatatcattatttatgattcttttcaaaaggaaatta
aaaaattattgggtatcaagaataaaacattaaaaactttgagataaatcattcttggaaacatcaggat
catttattattaagttcatttcttttcaactcatgtcattgtcttatacaaaaagtaatcttaaatattt
ggactctttatatttataaccctacaaaagcattatctttcagtatcatgtctctcatattaaaataata
ttgattttgaaaacctaggtactccttttaaagtttctttttggatatagatgaaagtcacatcattacc
tttgtgacttaaaaataatcgatacatatataacagttagaatttaatttctaaggaatgtaatatatat
atatatatatatatatatcagtttattctaaatatattttgctctcatacatattttctggaataataaa
gtagattttattgagtagatacaaatattaacatctatattctcttcaatctatttatgagacttgcttt
ctcaattaaatctattgttcacatcttttctttccatcttttccaagattgataacaagattagacaact
catccaagagatatgacaacttatgtcacattttgtttcttacaaaatttattaaaattcgcaagtaacc
ataaaaagcactataatttaccatcgagattccaaattcgattgacaagatttgcatggcatttaacttt
ttctatttaatatacaagtaatattcttttgggcaaaaaaaaaaaatacaagtaatattcctaaactgtc
aaaggacacataacctgaaaaaaggtaacctcccctcttattttcatccattacttatcttcgacatctt
tcttctaccctattagtttcaaaaaaaaaaaagatgttgagagatgatagaggtggttattttaaaggta
tctcatatctatctcaactttctcaaaaaaaaaagattggaaggtttttgtgaagctactatgttggtgg
gtaacacttcctcatgagggtgggaagtgttaccaaatgatcttgtgcgacgagatggtaatttgttttt
tgatctaatctattaataatttaatagtattccttggatctaatctattaataattcataagtcaatttt
tttttttagggcacaatgattgatgccatttgtgcttatttctacactggatatgacgtccctagagttc
tcaatgaaggaggttggtttttcttggaaaacatacttctgatcaaatcagtcggcggtagaaaacctcc
cttaactgataataagttgagaatcaagttccttcagactaccaaaatgactcctgtgcctaatagagaa
ccaagtaactttttccgatttgctgccttctctatgatcgaaaacaagactattaattcttcaactgttc
atggtaactttcttatttagatttttcactaatataaagtctatttttttgaaaatattaatctttcata
ttatcgttttttttgtttgtagatgcttatggtattgtcgtgagagttgggaatataacaagaccggact
ttgtccctcaagcttcagaaaatactatactttctcaatttctcgaatttgagattaaaaattcttggtt
agtattttccactatatagttcgtcatctatttggttatatatttgaatgcacaaacatagtaaatattg
ttatctttatagttggtttaattcatagaacttagatgttttggtggaataatttgatattgttattagg
ggtaaatctctcatatgtgttgcaagcggatatacttgtgagttgtttgtgcaattatggaggggacttg
gtctagaacttggttatcactggaactttggtatgaatcctacaatctgtgtgctacgattttggaatgt
tgatgatcatgaaggtatatttaagactcattttatgttatctataatttatatagctacttcatataat
aaaaacgttaatattttaggtcgtcaatgtctaatctcacataatggtgcttcaagaattacattcaatc
aaagttacccagagattaacatggatcgcgtcaggtaagaacgtttatatttacattatcccttaactgt
ttattgtattttttaaaattttggtcttggttatttttaatttttctattttcctactgtttcagaactc
aattccttcaacgaatgcaaacacctgagctagatgaagttgtggacgagaactgaaaatgcaacaccag
acccctatctatcgttttgtttaaaaacttatctacatatgttttaaagttgtacttttaaagactttgt
ttatttttttattgactttcttatgattatttctgttaaactttaactttattataactccttttattta
atgcttactaaataactatataaccgtaaacttagatcaaattataactgcttttagattggccaattat
taggttattttgatttaaataatgttgatattttattgattttaataaaatgtatttggattgcaaattt
tgattacaatgtaatctaaaatatgagttagatatctacactattaaacaaagaaaaataaaaaccaaac
cttagagtttattagaagatttgtccaaagaaatatgtcgttaaaatcaacatcgttagagaatcttcta
agttgaaaacatttattatttcaactcttatatataagtgccataatagaattaaattatagattctgtt
gttaacaatatatttgcatatatattgtttcctaatttttaatcacttccattattaaaaatattttaaa
attttgttacttatttctctccattattattaacttttatggaaattttgttattatatgtctcaaacat
tataggatcctgtgattattagtaatttatccacgcagttaagacaattggtatttatataagaactcca
attaataataaggatacaatatttatattatttcctaaaatataagactcgccaaatttttaattttatt
aataattgatttattcaaaatatattacagaatcttcaagattacgaagtgacttgaaacgtcatgactg
ttattactttttaaaaaagttgcgtctaaaacatgcctctacggtgtatttgtctcttatatatatatat
atcggtatcattagcatctcataaaacgaatacaaaaaaataactaagaaatttctgccaaaagatggaa
tcgtttcatcctctttcactgttgaaaccgtctattagaggatggtgtattcgtgggagagttgtgagga
cattcttagtttcgctggttccatcttcaaaggttatgggtttgattctcgccgacgaacatgtaagtat
tgactgttttgtaatgataattctaggtttgcatgttttagaattttgattagtatgtttgatccgtagg
gtatgactattgaagctactgttgggtataagatgtcggatcactataaagattttattaatgaaggaga
atgggtaacgataacaaattttggagttgttgagaactcgggttctgtcagggcaacaactcatagcttc
aaaattggattttctgttgacactgtcgtcagattaacaagtccggtacccgctattcctcactatcgtc
tagcatccttctcttcgattattgatgatgaaatcgataaatctgttttagtcggtgagatttttatgaa
tttgttgtgttccttattttatatcatgcatcttagtgttcattagttttgtcattttcaatatcaattg
tatatatttgactctgatttattttaattaatttatgtaattttttggagacttggtgggagcgatctat
gatgttggagaattgattaacacaagacctaagcaaaacaacgtcgatgatttgacgctaacattcaaaa
taagtgacaatgagtaagtttccttctttgatagtttaattcgaattacctaaattatactattctaata
atatttttgattttatgtttagaaaccgtgttttggaatgtctagctactaagaaggaagctcttgactt
tgatcataattatcgtcgatatggtggtggagttattgtcgctgttcttggttggtggaagattgaccgt
tattttgatggtccaaagaacgtacgtgtttgcaccgcaggcccgatatcaaccgtctttccggatcctg
atattcccgagtctaacgagatccatgagatgtaagttttgatctatcatcaaatattcttacatttcgt
tattagtaattatataaacggaatatctatactattatttataattgcataccacatttgtttgttttgt
aggctccgtgatgaaggtgcaaggaatggcggttgaacatctacttaaaaaatgtttttacatgtagcct
attgaactcggtctattattatttttatttctgtatgaacaagtttccatttttatttctgtatgaacaa
gtttacatatttcgaatttagaataccttctaaaacttgatatcttacaatatcgcatcgctattattga
caaaatttaatatgattcatcctaaaataaatcttagaaggtatgacaaaatttaatatcaaagattatt
gctttttttttaaacatcttaatattgctttatatatctaattctaatatttatttattcgtctgtctct
atcagaattgcaaaatttagaaaaatatatttattattgctttggcttatgtctcatataacataattat
tttatcaacaaatgttagtttcacattctgtaaatataaacatatataaaattagaaattttctgattat
gagatactgttaaacttctataacacttacatacacgaaaatgtacaaagctactatgtgtaaacctaca
tatacaaaatataaaattacgttcccaaacgtacatatcaacttagacattgtttccatgctacaacccg
aggaaactatatatacttaccaaaatattgtttgacgagactaaatatatttattttattccaatgatac
atgatatacaactatatgtttacatataatgaaaataaagtagagtttatgtggaatacacagaacttat
atttgatgattgatttaaccaaagataccgtgcgtagcacgggtactgacctag1