Fasta

>AT5G09590.1 |  MTHSC70-2 (MITOCHONDRIAL HSP70 2) ATP binding 
MATAALLRSIRRREVVSSPFSAYRCLSSSGKASLNSSYLGQNFRSFSRAFSSKPAGNDVI 
GIDLGTTNSCVAVMEGKNPKVIENAEGARTTPSVVAFNTKGELLVGTPAKRQAVTNPTNT 
VSGTKRLIGRKFDDPQTQKEMKMVPYKIVRAPNGDAWVEANGQQYSPSQIGAFILTKMKE 
TAEAYLGKSVTKAVVTVPAYFNDAQRQATKDAGRIAGLDVERIINEPTAAALSYGMTNKE 
GLIAVFDLGGGTFDVSVLEISNGVFEVKATNGDTFLGGEDFDNALLDFLVNEFKTTEGID 
LAKDRLALQRLREAAEKAKIELSSTSQTEINLPFITADASGAKHFNITLTRSRFETLVNH 
LIERTRDPCKNCLKDAGISAKEVDEVLLVGGMTRVPKVQSIVAEIFGKSPSKGVNPDEAV 
AMGAALQGGILRGDVKELLLLDVTPLSLGIETLGGVFTRLITRNTTIPTKKSQVFSTAAD 
NQTQVGIRVLQGEREMATDNKLLGEFDLVGIPPSPRGVPQIEVTFDIDANGIVTVSAKDK 
TTGKVQQITIRSSGGLSEDDIQKMVREAELHAQKDKERKELIDTKNTADTTIYSIEKSLG 
EYREKIPSEIAKEIEDAVADLRSASSGDDLNEIKAKIEAANKAVSKIGEHMSGGSGGGSA 
PGGGSEGGSDQAPEAEYEEVKK*>AT1G09810.1 |  ECT11 (evolutionarily conserved C-terminal region 11) 
MATEKNTLDSEATFAQTVPALDSTTKKQDESPPKSTPSLTVTACANGSDVVSSQPNDNGQ 
AHTTDFRKGNHRDKNSSDVYADSTLRGDRPKGSNCLSQTSFSAPKPLGNFNGAGRLPPNT 
QAHAFRPPFKGKEAAGQFLTFSNQKTSCVPYSGYINGNSNNGFWDQRDHNKKPERNGESD 
YLVELKCGPRANAKTRPPSESSPLKQNNSFALALRREMYNLPDFQTDYEDAKFFVIKSYS 
EDDVHKSIKYSVWSSTINGNKKLDAAFRDAETKTLEDGKKRPIFLFFSVNASRQFVGLAE 
MVGYVDFNKDLDFWQVDKWSGFFPVEWHVVKDIPNWELRHIILDNNEDKPVTHTRDTHEI 
KLKEGLQMLSIFKKYSAVTFLLDDMDFYEEREKSLRAKKEHKPATLRMDLFKEKDYDYEM 
EGNRRMNHQERGYNWNRSSNSKTQASLVNQTKYLSIRGYSGYKKNTGNST*>AT1G07810.1 |  ECA1 (ER-TYPE CA2+-ATPASE 1) calcium-transporting ATPase 
MGKGSEDLVKKESLNSTPVNSDTFPAWAKDVAECEEHFVVSREKGLSSDEVLKRHQIYGL 
NELEKPEGTSIFKLILEQFNDTLVRILLAAAVISFVLAFFDGDEGGEMGITAFVEPLVIF 
LILIVNAIVGIWQETNAEKALEALKEIQSQQATVMRDGTKVSSLPAKELVPGDIVELRVG 
DKVPADMRVVALISSTLRVEQGSLTGESEAVSKTTKHVDENADIQGKKCMVFAGTTVVNG 
NCICLVTDTGMNTEIGRVHSQIQEAAQHEEDTPLKKKLNEFGEVLTMIIGLICALVWLIN 
VKYFLSWEYVDGWPRNFKFSFEKCTYYFEIAVALAVAAIPEGLPAVITTCLALGTRKMAQ 
KNALVRKLPSVETLGCTTVICSDKTGTLTTNQMAVSKLVAMGSRIGTLRSFNVEGTSFDP 
RDGKIEDWPMGRMDANLQMIAKIAAICNDANVEQSDQQFVSRGMPTEAALKVLVEKMGFP 
EGLNEASSDGDVLRCCRLWSELEQRIATLEFDRDRKSMGVMVDSSSGNKLLLVKGAVENV 
LERSTHIQLLDGSKRELDQYSRDLILQSLRDMSLSALRCLGFAYSDVPSDFATYDGSEDH 
PAHQQLLNPSNYSSIESNLIFVGFVGLRDPPRKEVRQAIADCRTAGIRVMVITGDNKSTA 
EAICREIGVFEADEDISSRSLTGIEFMDVQDQKNHLRQTGGLLFSRAEPKHKQEIVRLLK 
EDGEVVAMTGDGVNDAPALKLADIGVAMGISGTEVAKEASDMVLADDNFSTIVAAVGEGR 
SIYNNMKAFIRYMISSNIGEVASIFLTAALGIPEGMIPVQLLWVNLVTDGPPATALGFNP 
PDKDIMKKPPRRSDDSLITAWILFRYMVIGLYVGVATVGVFIIWYTHSSFMGIDLSQDGH 
SLVSYSQLAHWGQCSSWEGFKVSPFTAGSQTFSFDSNPCDYFQQGKIKASTLSLSVLVAI 
EMFNSLNALSEDGSLVTMPPWVNPWLLLAMAVSFGLHFVILYVPFLAQVFGIVPLSLNEW 
LLVLAVSLPVILIDEVLKFVGRCTSGYRYSPRTLSTKQKEE*>AT1G77750.1 |  30S ribosomal protein S13 chloroplast putative 
MLGLRRSATTLFDISQSLLRNVTFHGLRVQGIRVGNAEVPNNKPLKTGLQEVYGIGRRKS 
HQVLCHLGITNKLARDLTGKELIDLREEVGQHQHGDELRRRVGSEIQRLVEVDCYRGSRH 
RHGLPCRGQRTSTNARTKKGKAVAIAGKKKAPRK*>AT4G14350.1 |  protein kinase family protein 
METAKAWLSKLKSKDKVKSSKKKEATSNVKEGPKTAGGEEALSNITKEKAAAAKLYIENH 
YKMQMQSLQERKERRKMLEKKLAAAEVSEEEQNNLLKDLEMKETEYMRRQRHKMGADDFE 
PLTMIGKGAFGEVRICREKGTGNVYAMKKLKKSEMLRRGQVEHVKAERNLLAEVDSNCIV 
KLYCSFQDEEYLYLIMEYLPGGDMMTLLMRKDTLTEDEARFYIGETVLAIESIHKHNYIH 
RDIKPDNLLLDKDGHMKLSDFGLCKPLDCSNLQEKDFTVARNVSGALQSDGRPVATRRTQ 
QEQLLNWQRNRRMLAYSTVGTPDYIAPEVLLKKGYGMECDWWSLGAIMYEMLVGFPPFYS 
DDPMTTCRKIVNWRNYLKFPDEVRLSPEAKDLICRLLCNVEQRLGTKGADEIKGHPWFRG 
TEWGKLYQMKAAFIPQVNDELDTQNFEKFEETDKQVPKSAKSGPWRKMLSSKDINFVGYT 
YKNVEIVNDDQIPGIAELKKKSNKPKRPSIKSLFEDETSGGTTTHQGSFLNLLPTQIEDP 
EKEGSKSSSSG*>AT4G14350.1 |  protein kinase family protein 
METAKAWLSKLKSKDKVKSSKKKEATSNVKEGPKTAGGEEALSNITKEKAAAAKLYIENH 
YKMQMQSLQERKERRKMLEKKLAAAEVSEEEQNNLLKDLEMKETEYMRRQRHKMGADDFE 
PLTMIGKGAFGEVRICREKGTGNVYAMKKLKKSEMLRRGQVEHVKAERNLLAEVDSNCIV 
KLYCSFQDEEYLYLIMEYLPGGDMMTLLMRKDTLTEDEARFYIGETVLAIESIHKHNYIH 
RDIKPDNLLLDKDGHMKLSDFGLCKPLDCSNLQEKDFTVARNVSGALQSDGRPVATRRTQ 
QEQLLNWQRNRRMLAYSTVGTPDYIAPEVLLKKGYGMECDWWSLGAIMYEMLVGFPPFYS 
DDPMTTCRKIVNWRNYLKFPDEVRLSPEAKDLICRLLCNVEQRLGTKGADEIKGHPWFRG 
TEWGKLYQMKAAFIPQVNDELDTQNFEKFEETDKQVPKSAKSGPWRKMLSSKDINFVGYT 
YKNVEIVNDDQIPGIAELKKKSNKPKRPSIKSLFEDETSGGTTTHQGSFLNLLPTQIEDP 
EKEGSKSSSSG*>AT4G14350.1 |  protein kinase family protein 
METAKAWLSKLKSKDKVKSSKKKEATSNVKEGPKTAGGEEALSNITKEKAAAAKLYIENH 
YKMQMQSLQERKERRKMLEKKLAAAEVSEEEQNNLLKDLEMKETEYMRRQRHKMGADDFE 
PLTMIGKGAFGEVRICREKGTGNVYAMKKLKKSEMLRRGQVEHVKAERNLLAEVDSNCIV 
KLYCSFQDEEYLYLIMEYLPGGDMMTLLMRKDTLTEDEARFYIGETVLAIESIHKHNYIH 
RDIKPDNLLLDKDGHMKLSDFGLCKPLDCSNLQEKDFTVARNVSGALQSDGRPVATRRTQ 
QEQLLNWQRNRRMLAYSTVGTPDYIAPEVLLKKGYGMECDWWSLGAIMYEMLVGFPPFYS 
DDPMTTCRKIVNWRNYLKFPDEVRLSPEAKDLICRLLCNVEQRLGTKGADEIKGHPWFRG 
TEWGKLYQMKAAFIPQVNDELDTQNFEKFEETDKQVPKSAKSGPWRKMLSSKDINFVGYT 
YKNVEIVNDDQIPGIAELKKKSNKPKRPSIKSLFEDETSGGTTTHQGSFLNLLPTQIEDP 
EKEGSKSSSSG*>AT4G14350.2 |  protein kinase family protein 
METAKAWLSKLKSKDKVKSSKKKEATSNVKEGPKTAGGEEALSNITKEKAAAAKLYIENH 
YKMQMQSLQERKERRKMLEKKLAAAEVSEEEQNNLLKDLEMKETEYMRRQRHKMGADDFE 
PLTMIGKGAFGEVRICREKGTGNVYAMKKLKKSEMLRRGQVEHVKAERNLLAEVDSNCIV 
KLYCSFQDEEYLYLIMEYLPGGDMMTLLMRKDTLTEDEARFYIGETVLAIESIHKHNYIH 
RDIKPDNLLLDKDGHMKLSDFGLCKPLDCSNLQEKDFTVARNVSGALQSDGRPVATRRTQ 
QEQLLNWQRNRRMLAYSTVGTPDYIAPEVLLKKGYGMECDWWSLGAIMYEMLVGFPPFYS 
DDPMTTCRKIVNWRNYLKFPDEVRLSPEAKDLICRLLCNVEQRLGTKGADEIKGHPWFRG 
TEWGKLYQMKAAFIPQVNDELDTQNFEKFEETDKQVPKSAKSGPWRKMLSSKDINFVGYT 
YKNVEIVNDDQIPGIAELKKKSNKPKRPSIKSLFEDETSGGTTTHQGSFLNLLPTQIEDP 
EKEGSKSSSSG*>AT4G14350.2 |  protein kinase family protein 
METAKAWLSKLKSKDKVKSSKKKEATSNVKEGPKTAGGEEALSNITKEKAAAAKLYIENH 
YKMQMQSLQERKERRKMLEKKLAAAEVSEEEQNNLLKDLEMKETEYMRRQRHKMGADDFE 
PLTMIGKGAFGEVRICREKGTGNVYAMKKLKKSEMLRRGQVEHVKAERNLLAEVDSNCIV 
KLYCSFQDEEYLYLIMEYLPGGDMMTLLMRKDTLTEDEARFYIGETVLAIESIHKHNYIH 
RDIKPDNLLLDKDGHMKLSDFGLCKPLDCSNLQEKDFTVARNVSGALQSDGRPVATRRTQ 
QEQLLNWQRNRRMLAYSTVGTPDYIAPEVLLKKGYGMECDWWSLGAIMYEMLVGFPPFYS 
DDPMTTCRKIVNWRNYLKFPDEVRLSPEAKDLICRLLCNVEQRLGTKGADEIKGHPWFRG 
TEWGKLYQMKAAFIPQVNDELDTQNFEKFEETDKQVPKSAKSGPWRKMLSSKDINFVGYT 
YKNVEIVNDDQIPGIAELKKKSNKPKRPSIKSLFEDETSGGTTTHQGSFLNLLPTQIEDP 
EKEGSKSSSSG*>AT4G14350.2 |  protein kinase family protein 
METAKAWLSKLKSKDKVKSSKKKEATSNVKEGPKTAGGEEALSNITKEKAAAAKLYIENH 
YKMQMQSLQERKERRKMLEKKLAAAEVSEEEQNNLLKDLEMKETEYMRRQRHKMGADDFE 
PLTMIGKGAFGEVRICREKGTGNVYAMKKLKKSEMLRRGQVEHVKAERNLLAEVDSNCIV 
KLYCSFQDEEYLYLIMEYLPGGDMMTLLMRKDTLTEDEARFYIGETVLAIESIHKHNYIH 
RDIKPDNLLLDKDGHMKLSDFGLCKPLDCSNLQEKDFTVARNVSGALQSDGRPVATRRTQ 
QEQLLNWQRNRRMLAYSTVGTPDYIAPEVLLKKGYGMECDWWSLGAIMYEMLVGFPPFYS 
DDPMTTCRKIVNWRNYLKFPDEVRLSPEAKDLICRLLCNVEQRLGTKGADEIKGHPWFRG 
TEWGKLYQMKAAFIPQVNDELDTQNFEKFEETDKQVPKSAKSGPWRKMLSSKDINFVGYT 
YKNVEIVNDDQIPGIAELKKKSNKPKRPSIKSLFEDETSGGTTTHQGSFLNLLPTQIEDP 
EKEGSKSSSSG*>AT4G14350.3 |  protein kinase family protein 
METAKAWLSKLKSKDKVKSSKKKEATSNVKEGPKTAGGEEALSNITKEKAAAAKLYIENH 
YKMQMQSLQERKERRKMLEKKLAAAEVSEEEQNNLLKDLEMKETEYMRRQRHKMGADDFE 
PLTMIGKGAFGEVRICREKGTGNVYAMKKLKKSEMLRRGQVEHVKAERNLLAEVDSNCIV 
KLYCSFQDEEYLYLIMEYLPGGDMMTLLMRKDTLTEDEARFYIGETVLAIESIHKHNYIH 
RDIKPDNLLLDKDGHMKLSDFGLCKPLDCSNLQEKDFTVARNVSGALQSDGRPVATRRTQ 
QEQLLNWQRNRRMLAYSTVGTPDYIAPEVLLKKGYGMECDWWSLGAIMYEMLVGFPPFYS 
DDPMTTCRKIVNWRNYLKFPDEVRLSPEAKDLICRLLCNVEQRLGTKGADEIKGHPWFRG 
TEWGKLYQMKAAFIPQVNDELDTQNFEKFEETDKQVPKSAKSGPWRKMLSSKDINFVGYT 
YKNVEIVNDDQIPGIAELKKKSNKPKRPSIKSLFEDETSGGTTTHQGSFLNLLPTQIEDP 
EKEAFCFL*>AT4G14350.3 |  protein kinase family protein 
METAKAWLSKLKSKDKVKSSKKKEATSNVKEGPKTAGGEEALSNITKEKAAAAKLYIENH 
YKMQMQSLQERKERRKMLEKKLAAAEVSEEEQNNLLKDLEMKETEYMRRQRHKMGADDFE 
PLTMIGKGAFGEVRICREKGTGNVYAMKKLKKSEMLRRGQVEHVKAERNLLAEVDSNCIV 
KLYCSFQDEEYLYLIMEYLPGGDMMTLLMRKDTLTEDEARFYIGETVLAIESIHKHNYIH 
RDIKPDNLLLDKDGHMKLSDFGLCKPLDCSNLQEKDFTVARNVSGALQSDGRPVATRRTQ 
QEQLLNWQRNRRMLAYSTVGTPDYIAPEVLLKKGYGMECDWWSLGAIMYEMLVGFPPFYS 
DDPMTTCRKIVNWRNYLKFPDEVRLSPEAKDLICRLLCNVEQRLGTKGADEIKGHPWFRG 
TEWGKLYQMKAAFIPQVNDELDTQNFEKFEETDKQVPKSAKSGPWRKMLSSKDINFVGYT 
YKNVEIVNDDQIPGIAELKKKSNKPKRPSIKSLFEDETSGGTTTHQGSFLNLLPTQIEDP 
EKEAFCFL*>AT4G14350.3 |  protein kinase family protein 
METAKAWLSKLKSKDKVKSSKKKEATSNVKEGPKTAGGEEALSNITKEKAAAAKLYIENH 
YKMQMQSLQERKERRKMLEKKLAAAEVSEEEQNNLLKDLEMKETEYMRRQRHKMGADDFE 
PLTMIGKGAFGEVRICREKGTGNVYAMKKLKKSEMLRRGQVEHVKAERNLLAEVDSNCIV 
KLYCSFQDEEYLYLIMEYLPGGDMMTLLMRKDTLTEDEARFYIGETVLAIESIHKHNYIH 
RDIKPDNLLLDKDGHMKLSDFGLCKPLDCSNLQEKDFTVARNVSGALQSDGRPVATRRTQ 
QEQLLNWQRNRRMLAYSTVGTPDYIAPEVLLKKGYGMECDWWSLGAIMYEMLVGFPPFYS 
DDPMTTCRKIVNWRNYLKFPDEVRLSPEAKDLICRLLCNVEQRLGTKGADEIKGHPWFRG 
TEWGKLYQMKAAFIPQVNDELDTQNFEKFEETDKQVPKSAKSGPWRKMLSSKDINFVGYT 
YKNVEIVNDDQIPGIAELKKKSNKPKRPSIKSLFEDETSGGTTTHQGSFLNLLPTQIEDP 
EKEAFCFL*>AT1G21700.1 |  ATSWI3C (SWITCH/SUCROSE NONFERMENTING 3C) DNA binding 
MPASEDRRGKWKRKKRGGLSAARKPKQEEEDMEEEDEENNNNNNEEMDDVENADELQQNG 
GATPDPGLGIGEVVEDSGSRISDFPAVVKRVVIRPHASVMAVVAAERAGLIGETRGQGSL 
PALENISFGQLQALSTVPADSLDLERSDGSSSAYVISPPPIMDGEGVVKRFGDLVHVLPM 
HSDWFAPNTVDRLERQVVPQFFSGKSPNHTPESYMEFRNAIVSKYVENPEKTLTISDCQG 
LVDGVDIEDFARVFRFLDHWGIINYCATAQSHPGPLRDVSDVREDTNGEVNVPSAALTSI 
DSLIKFDKPNCRHKGGEVYSSLPSLDGDSPDLDIRIREHLCDSHCNHCSRPLPTVYFQSQ 
KKGDILLCCDCFHHGRFVVGHSCLDFVRVDPMKFYGDQDGDNWTDQETLLLLEAVELYNE 
NWVQIADHVGSKSKAQCILHFLRLPVEDGLLDNVEVSGVTNTENPTNGYDHKGTDSNGDL 
PGYSEQGSDTEIKLPFVKSPNPVMALVAFLASAVGPRVAASCAHESLSVLSEDDRMKSEG 
MQGKEASLLDGENQQQDGAHKTSSQNGAEAQTPLPQDKVMAAFRAGLSAAATKAKLFADH 
EEREIQRLSANIVNHQLKRMELKLKQFAEIETLLMKECEQVEKTRQRFSAERARMLSARF 
GSPGGISPQTNNLQGMSLSTGGNNINSLMHQQHQQQQASATSQPSIIPGFSNNPQVQAQM 
HFMARQQQQQQQQQQQQQQAFSFGPRLPLNAIQTNAGSTASPNVMFGNNQLNNPAAAGAA 
SINQPSFSHPMVRSSTGSGSGSGLGLN*>AT3G13900.1 |  ATPase coupled to transmembrane movement of ions phosphorylative mechanism 
MGRRRIRSRIRKSHFYTFKCLRPKTLEDQGPHIINGPGYTRIVHCNQPHLHLAKVLRYTS 
NYVSTTRYNLITFLPKCLYEQFHRVANFYFLVAAILSVFPLSPFNKWSMIAPLIFVVGLS 
MGKEALEDWRRFMQDVKVNSRKATVHRGDGDFGRRKWKKLRVGDVVKVEKDQFFPADLLL 
LSSSYEDGICYVETMNLDGETNLKVKRCLDVTLPLERDDTFQSFSGTIKCEDPNPNLYTF 
VGNLEYDGQVYPLDPSQILLRDSKLRNTSYVYGVVVFTGHDTKVMQNSTKSPSKRSRIEK 
RMDYIIYTLFALLVLVSFISSLGFAVMTKMHMGDWWYLRPDKPERLTNPRNPFHAWVVHL 
ITAVLLYGYLIPISLYVSIELVKVLQATFINQDLQMYDSESGTPAQARTSNLNEELGQVD 
TILSDKTGTLTCNQMDFLKCSIAGTSYGVRASEVELAAAKQMAIDLDEEQGEEVTHLPRT 
RGRMHGYAKMPSKTSSDIELETVITATDEGDQTQSTGIKGFSFEDQRLMGGNWLNEPNSD 
DILMFLRILAVCHTAIPEVDEDTGKCTYEAESPDEVAFLVAAGEFGFEFTKRTQSSVFIS 
ERHSGQPVEREYKVLNVLDFTSKRKRMSVIVRDEKGQILLLCKGADSIIFERLSKNGKNY 
LEATSKHLNGYGEAGLRTLALSYRKLDETEYSIWNSEFHKAKTSVGADRDEMLEKVSDMM 
EKELILVGATAVEDKLQKGVPQCIDKLAQAGLKIWVLTGDKMETAINIGYACSLLRQGMK 
QIYIALRNEEGSSQDPEAAARENILMQIINASQMIKLEKDPHAAFALIIDGKTLTYALED 
DIKYQFLALAVDCASVICCRVSPKQKALVTRLAKEGTGKTTLAIGDGANDVGMIQEADIG 
VGISGVEGMQAVMASDFSIAQFRFLERLLVVHGHWCYKRIAQMICYFFYKNITFGLTLFY 
FEAFTGFSGQAIYNDSYLLLFNVILTSLPVIALGVFEQDVSSEVCLQFPALYQQGPKNLF 
FDWYRIIGWMANGVYASVVIFSLNIGIFHVQSFCSGGQTADMDAMGTAMFTCIIWAVNVQ 
IALTMSHFTWIQHVLIWGSIVTWYIFLALFGMLPPKVSGNIFHMLSETLAPAPIFWLTSL 
LVIAATTLPYLAYISFQRSLNPLDHHIIQEIKHFRIDVQDECMWTRERSKAREKTKIGVT 
ARVDAKIRQLRGRLQRKHSILSVMSGLSGVSASTDTTSTTQHS*>AT3G03950.1 |  protein binding 
MAGAASSDRLVTSFPLLDLFQDLSLGSDANEVPMNFTKGSFQHPYGHAPYGASSHGSERR 
PNMNAGNLLNGGDSIGSYPWGYIPANYPSGGYPDPRFGYDRNSNHSSFSHLMNPHSSQEV 
PSFDQLGYNDHLYSNHGLYGLYGNVIDSGHAYGTFGYDSWKLGRGWYPVDGYRKTRSFNH 
GRGYSDEKADRLNELCRGPRSSDFKNPQVLNSSMLDAMKQDVSAVDLQRYNGENFPESFV 
KAKFFVIKSYSEDDVHNCIKYGAWSSTPTGNKKLNAAYYEAKENSQECPVYLLFSVNASG 
QFVGLAEMVGPVDFNKTMEYWQQDKWIGCFPVKWHIIKDIPNSLLRHITLANNENKPVTN 
SRDTQEVNLEHGTKIIKIFKEYMSKTCILDDYKFYETRQKIIRDKKIKQKKQALDGASGE 
TINLS*>AT3G03950.1 |  protein binding 
MAGAASSDRLVTSFPLLDLFQDLSLGSDANEVPMNFTKGSFQHPYGHAPYGASSHGSERR 
PNMNAGNLLNGGDSIGSYPWGYIPANYPSGGYPDPRFGYDRNSNHSSFSHLMNPHSSQEV 
PSFDQLGYNDHLYSNHGLYGLYGNVIDSGHAYGTFGYDSWKLGRGWYPVDGYRKTRSFNH 
GRGYSDEKADRLNELCRGPRSSDFKNPQVLNSSMLDAMKQDVSAVDLQRYNGENFPESFV 
KAKFFVIKSYSEDDVHNCIKYGAWSSTPTGNKKLNAAYYEAKENSQECPVYLLFSVNASG 
QFVGLAEMVGPVDFNKTMEYWQQDKWIGCFPVKWHIIKDIPNSLLRHITLANNENKPVTN 
SRDTQEVNLEHGTKIIKIFKEYMSKTCILDDYKFYETRQKIIRDKKIKQKKQALDGASGE 
TINLS*>AT3G03950.1 |  protein binding 
MAGAASSDRLVTSFPLLDLFQDLSLGSDANEVPMNFTKGSFQHPYGHAPYGASSHGSERR 
PNMNAGNLLNGGDSIGSYPWGYIPANYPSGGYPDPRFGYDRNSNHSSFSHLMNPHSSQEV 
PSFDQLGYNDHLYSNHGLYGLYGNVIDSGHAYGTFGYDSWKLGRGWYPVDGYRKTRSFNH 
GRGYSDEKADRLNELCRGPRSSDFKNPQVLNSSMLDAMKQDVSAVDLQRYNGENFPESFV 
KAKFFVIKSYSEDDVHNCIKYGAWSSTPTGNKKLNAAYYEAKENSQECPVYLLFSVNASG 
QFVGLAEMVGPVDFNKTMEYWQQDKWIGCFPVKWHIIKDIPNSLLRHITLANNENKPVTN 
SRDTQEVNLEHGTKIIKIFKEYMSKTCILDDYKFYETRQKIIRDKKIKQKKQALDGASGE 
TINLS*>AT3G03950.2 |  protein binding 
MAGAASSDRLVTSFPLLDTADLFQDLSLGSDANEVPMNFTKHPYGHAPYGASSHGSERRP 
NMNAGNLLNGGDSIGSYPWGYIPANYPSGGYPDPRFGYDRNSNHSSFSHLMNPHSSQEVP 
SFDQLGYNDHLYSNHGLYGLYGNVIDSGHAYGTFGYDSWKLGRGWYPVDGYRKTRSFNHG 
RGYSDEKADRLNELCRGPRSSDFKNPQVLNSSMLDAMKQDVSAVDLQRYNGENFPESFVK 
AKFFVIKSYSEDDVHNCIKYGAWSSTPTGNKKLNAAYYEAKENSQECPVYLLFSVNASGQ 
FVGLAEMVGPVDFNKTMEYWQQDKWIGCFPVKWHIIKDIPNSLLRHITLANNENKPVTNS 
RDTQEVNLEHGTKIIKIFKEYMSKTCILDDYKFYETRQKIIRDKKIKQKKQALDGASGET 
INLS*>AT3G03950.2 |  protein binding 
MAGAASSDRLVTSFPLLDTADLFQDLSLGSDANEVPMNFTKHPYGHAPYGASSHGSERRP 
NMNAGNLLNGGDSIGSYPWGYIPANYPSGGYPDPRFGYDRNSNHSSFSHLMNPHSSQEVP 
SFDQLGYNDHLYSNHGLYGLYGNVIDSGHAYGTFGYDSWKLGRGWYPVDGYRKTRSFNHG 
RGYSDEKADRLNELCRGPRSSDFKNPQVLNSSMLDAMKQDVSAVDLQRYNGENFPESFVK 
AKFFVIKSYSEDDVHNCIKYGAWSSTPTGNKKLNAAYYEAKENSQECPVYLLFSVNASGQ 
FVGLAEMVGPVDFNKTMEYWQQDKWIGCFPVKWHIIKDIPNSLLRHITLANNENKPVTNS 
RDTQEVNLEHGTKIIKIFKEYMSKTCILDDYKFYETRQKIIRDKKIKQKKQALDGASGET 
INLS*>AT3G03950.2 |  protein binding 
MAGAASSDRLVTSFPLLDTADLFQDLSLGSDANEVPMNFTKHPYGHAPYGASSHGSERRP 
NMNAGNLLNGGDSIGSYPWGYIPANYPSGGYPDPRFGYDRNSNHSSFSHLMNPHSSQEVP 
SFDQLGYNDHLYSNHGLYGLYGNVIDSGHAYGTFGYDSWKLGRGWYPVDGYRKTRSFNHG 
RGYSDEKADRLNELCRGPRSSDFKNPQVLNSSMLDAMKQDVSAVDLQRYNGENFPESFVK 
AKFFVIKSYSEDDVHNCIKYGAWSSTPTGNKKLNAAYYEAKENSQECPVYLLFSVNASGQ 
FVGLAEMVGPVDFNKTMEYWQQDKWIGCFPVKWHIIKDIPNSLLRHITLANNENKPVTNS 
RDTQEVNLEHGTKIIKIFKEYMSKTCILDDYKFYETRQKIIRDKKIKQKKQALDGASGET 
INLS*>AT3G03950.3 |  protein binding 
MAGAASSDRLVTSFPLLDTADLFQDLSLGSDANEVPMNFTKGSFQHPYGHAPYGASSHGS 
ERRPNMNAGNLLNGGDSIGSYPWGYIPANYPSGGYPDPRFGYDRNSNHSSFSHLMNPHSS 
QEVPSFDQLGYNDHLYSNHGLYGLYGNVIDSGHAYGTFGYDSWKLGRGWYPVDGYRKTRS 
FNHGRGYSDEKADRLNELCRGPRSSDFKNPQVLNSSMLDAMKQDVSAVDLQRYNGENFPE 
SFVKAKFFVIKSYSEDDVHNCIKYGAWSSTPTGNKKLNAAYYEAKENSQECPVYLLFSVN 
ASGQFVGLAEMVGPVDFNKTMEYWQQDKWIGCFPVKWHIIKDIPNSLLRHITLANNENKP 
VTNSRDTQEVNLEHGTKIIKIFKEYMSKTCILDDYKFYETRQKIIRDKKIKQKKQALDGA 
SGETINLS*>AT3G03950.3 |  protein binding 
MAGAASSDRLVTSFPLLDTADLFQDLSLGSDANEVPMNFTKGSFQHPYGHAPYGASSHGS 
ERRPNMNAGNLLNGGDSIGSYPWGYIPANYPSGGYPDPRFGYDRNSNHSSFSHLMNPHSS 
QEVPSFDQLGYNDHLYSNHGLYGLYGNVIDSGHAYGTFGYDSWKLGRGWYPVDGYRKTRS 
FNHGRGYSDEKADRLNELCRGPRSSDFKNPQVLNSSMLDAMKQDVSAVDLQRYNGENFPE 
SFVKAKFFVIKSYSEDDVHNCIKYGAWSSTPTGNKKLNAAYYEAKENSQECPVYLLFSVN 
ASGQFVGLAEMVGPVDFNKTMEYWQQDKWIGCFPVKWHIIKDIPNSLLRHITLANNENKP 
VTNSRDTQEVNLEHGTKIIKIFKEYMSKTCILDDYKFYETRQKIIRDKKIKQKKQALDGA 
SGETINLS*>AT3G03950.3 |  protein binding 
MAGAASSDRLVTSFPLLDTADLFQDLSLGSDANEVPMNFTKGSFQHPYGHAPYGASSHGS 
ERRPNMNAGNLLNGGDSIGSYPWGYIPANYPSGGYPDPRFGYDRNSNHSSFSHLMNPHSS 
QEVPSFDQLGYNDHLYSNHGLYGLYGNVIDSGHAYGTFGYDSWKLGRGWYPVDGYRKTRS 
FNHGRGYSDEKADRLNELCRGPRSSDFKNPQVLNSSMLDAMKQDVSAVDLQRYNGENFPE 
SFVKAKFFVIKSYSEDDVHNCIKYGAWSSTPTGNKKLNAAYYEAKENSQECPVYLLFSVN 
ASGQFVGLAEMVGPVDFNKTMEYWQQDKWIGCFPVKWHIIKDIPNSLLRHITLANNENKP 
VTNSRDTQEVNLEHGTKIIKIFKEYMSKTCILDDYKFYETRQKIIRDKKIKQKKQALDGA 
SGETINLS*>AT1G10980.1 |  INVOLVED IN biological_process unknown LOCATED IN vacuole EXPRESSED IN 8 plant structures EXPRESSED DURING 6 growth stages CONTAINS InterPro DOMAIN/s Transmembrane receptor eukaryota (InterProIPR009637) BEST Arabidopsis thaliana protein match is unknown protein (TAIRAT1G616701) Has 482 Blast hits to 481 proteins in 121 species Archae - 0 Bacteria - 0 Metazoa - 255 Fungi - 99 Plants - 97 Viruses - 0 Other Eukaryotes - 31 (source NCBI BLink) 
MTNLFLGFLVISFCLLGNLIHAADGSIHDYNNSGGFTKIANARYFVGGSEGIYGSEFLDV 
HHASSDTPLLKGNSFIRFDDITFVRTKESASKQNSTLAAAGLVEAILFEVKQRDRVGGSF 
FKSEDMCCTPKLADAGSCNLGEVMISADPNDPEWPKRIPTFFKRGEEEVKMSPEAVIIKK 
TGLYTVYFMTCDPELDGATIRGRTVWKNRGGYLQGEKAPLKKFYASMLLAYVVLGLVWFP 
QVAQYWKDGIQLHSHINFVIAFTMGELAFLYLDFVYLDSAGTSPMEVTVWAITLSSMRKA 
LSRLLLLVISSGFGIVRPTLGGITLKMLLIGVLCFVISESLGLAMQFGNISENGMNYLML 
SWAILETCFIQWIFRSLSKTLKKLKLNKRNITKLQLYKMFATVLVIMVVLSFAWIYVEVY 
LYSSLSQFWKVKWIVPTLWYILSYAMLVLICLFWPPSEKPMRYLYVADMEEETEEEDDLS 
TAETGMNATKAEYERSERKTLLEAFILLLGNIPGEK*>AT1G66590.1 |  cox19 family protein 
MSTGGAFGGNRGLRPIPPEKGIFPLDHLHECDAEKKEYLGCLKSSAHKSEQCRHLSKKYL 
QCRMAKNLMAKQDMAELGFSGVKELDSTEDKNTESIEH*>AT1G66590.1 |  cox19 family protein 
MSTGGAFGGNRGLRPIPPEKGIFPLDHLHECDAEKKEYLGCLKSSAHKSEQCRHLSKKYL 
QCRMAKNLMAKQDMAELGFSGVKELDSTEDKNTESIEH*>AT1G66590.2 |  cox19 family protein 
MMITIKFDLNRYSCSWGAGGAFGGNRGLRPIPPEKGIFPLDHLHECDAEKKEYLGCLKSS 
AHKSEQCRHLSKKYLQCRMAKNLMAKQDMAELGFSGVKELDSTEDKNTESIEH*>AT1G66590.2 |  cox19 family protein 
MMITIKFDLNRYSCSWGAGGAFGGNRGLRPIPPEKGIFPLDHLHECDAEKKEYLGCLKSS 
AHKSEQCRHLSKKYLQCRMAKNLMAKQDMAELGFSGVKELDSTEDKNTESIEH*>AT1G78770.1 |  cell division cycle family protein 
MREEEIEKIRGVVRDCVSKHLYSSAIFFADKVAALTNDPSDIYMQAQALFLGRHYRRAFH 
LLNASKIVLRDLRFRYLAAKCLEELKEWDQCLLMLGDAKVDDDGIVYDAKDGNVIDFDKD 
GEDREINISSAICFLRGKAYGALQNRSQARQWYKAAIKADPLCYEALECLIESHMLTSEE 
ESSLLSSLQFSPEDGWLSSFYSCLIKKYDKESTVELKFKKLENETSGSVSGSSMITLANN 
TDLLACKAEYYHQCCEYQKCFELTAALLEKDPFHLKCTLVHLAAAMELGNSNELYLMACN 
LVKDYPSKALSWFAVGCYYYCIKKYAEARRYFSKATGIDGSFSPARIGYGNSFAAQEEGD 
QAMSAYRTAARLFPGCHLPTLYIGMEYMRTHSYKLADQFFMQAKAICPSDPLVYNELGVV 
AYHMKEYGKAVRWFEKTLAHIPSALTESWEPTVVNLAHAYRKLRKDREAISYYERALTLS 
TKSLSTYSGLAYTYHLQGNFSAAISYYHKALWLKPDDQFCTEMLNVALMDECQNGVDSKV 
ELC*>AT1G80500.1 |  FUNCTIONS IN molecular_function unknown INVOLVED IN transport ER to Golgi vesicle-mediated transport LOCATED IN intracellular EXPRESSED IN 24 plant structures EXPRESSED DURING 15 growth stages CONTAINS InterPro DOMAIN/s Sedlin (InterProIPR006722) Longin-like (InterProIPR011012) BEST Arabidopsis thaliana protein match is unknown protein (TAIRAT2G209301) Has 437 Blast hits to 435 proteins in 138 species Archae - 0 Bacteria - 0 Metazoa - 248 Fungi - 75 Plants - 53 Viruses - 0 Other Eukaryotes - 61 (source NCBI BLink) 
MANTACFIIVGRNDIPIYEAEVGSAAKREDAAQLHQFILHAALDVVQDLAWTTSAMFLKS 
VDRFNDLVVSVYVTAGHTRLMLLHDSRNEDGIKSFFQEVHELYIKILLNPLYLPGSRITS 
SHFDTKVRALARKYL*>AT2G24960.1 |  unknown protein 
MSNQTTCNDRTRTYWTPTMERFFIDLMLEHLHRGNRTGHTFNKQAWNEMLTVFNSKFGSQ 
YDKDVLKSRYTNLWKQYNDVKCLLDHGGFVWDQTHQTVIGDDSLWSLYLKAHPEARVYKT 
KPVLNFSDLCLIYGYTVADGRYSMSSHDLEIEDEINGESVVLSGKESSKTEWTLEMDQYF 
VEIMVDQIGRGNKTGNAFSKQAWIDMLVLFNARFSGQYGKRVLRHRYNKLLKYYKDMEAI 
LKEDGFSWDETRLMISADDAVWDSYIKDHPLARTYRMKSLPSYNDLDTIFACQAEQGTDH 
RDDGSAAQTSETKASQEQNSDRTRIFWTPPMDYHLIDLLVEQVNNGNRVGQTFITSAWNE 
MVTAFNAKFGSQHNKDVLKNRYKHLRRLYNDIKFLLEQNGFSWDARRDMVIADDDIWNTY 
IQACHILFLFKISVICLCLQMKHVQAHPEARSYRVKTIPSYPNLCFIFGKETSDGRYTRL 
AQAFDPSPAETVRMNESGSTDGFKDTRSFQKVVYTSNEKNDYPCSNIGPPCIEWTRVMDH 
CLIDLMLEQVSRGNKIGETFTEQAWADMAESFNAKFGLQTDMFMLENRYILLMKERDDIN 
NILNLDGFTWDVEKQTIVAEDEYWEAYIKEHPDATIYKGKTLDSYGNLCKLNEHLSQESF 
NCENLMIELENYGNEMEIVDDFSSPHKQQNKRPNPITPPLGIVVCKAQKTGVETRKPLCE 
TEGDDDDCTKPMPQIEIYSRIGNALDALQALPDMDDELLLDACDLLEDERKAKTFLALDV 
SLRRKWLVRKLRPSANV*>AT2G24960.1 |  unknown protein 
MSNQTTCNDRTRTYWTPTMERFFIDLMLEHLHRGNRTGHTFNKQAWNEMLTVFNSKFGSQ 
YDKDVLKSRYTNLWKQYNDVKCLLDHGGFVWDQTHQTVIGDDSLWSLYLKAHPEARVYKT 
KPVLNFSDLCLIYGYTVADGRYSMSSHDLEIEDEINGESVVLSGKESSKTEWTLEMDQYF 
VEIMVDQIGRGNKTGNAFSKQAWIDMLVLFNARFSGQYGKRVLRHRYNKLLKYYKDMEAI 
LKEDGFSWDETRLMISADDAVWDSYIKDHPLARTYRMKSLPSYNDLDTIFACQAEQGTDH 
RDDGSAAQTSETKASQEQNSDRTRIFWTPPMDYHLIDLLVEQVNNGNRVGQTFITSAWNE 
MVTAFNAKFGSQHNKDVLKNRYKHLRRLYNDIKFLLEQNGFSWDARRDMVIADDDIWNTY 
IQACHILFLFKISVICLCLQMKHVQAHPEARSYRVKTIPSYPNLCFIFGKETSDGRYTRL 
AQAFDPSPAETVRMNESGSTDGFKDTRSFQKVVYTSNEKNDYPCSNIGPPCIEWTRVMDH 
CLIDLMLEQVSRGNKIGETFTEQAWADMAESFNAKFGLQTDMFMLENRYILLMKERDDIN 
NILNLDGFTWDVEKQTIVAEDEYWEAYIKEHPDATIYKGKTLDSYGNLCKLNEHLSQESF 
NCENLMIELENYGNEMEIVDDFSSPHKQQNKRPNPITPPLGIVVCKAQKTGVETRKPLCE 
TEGDDDDCTKPMPQIEIYSRIGNALDALQALPDMDDELLLDACDLLEDERKAKTFLALDV 
SLRRKWLVRKLRPSANV*>AT2G24960.2 |  unknown protein 
MSNQTTCNDRTRTYWTPTMERFFIDLMLEHLHRGNRTGHTFNKQAWNEMLTVFNSKFGSQ 
YDKDVLKSRYTNLWKQYNDVKCLLDHGGFVWDQTHQTVIGDDSLWSLYLKAHPEARVYKT 
KPVLNFSDLCLIYGYTVADGRYSMSSHDLEIEDEINGESVVLSGKESSKTEWTLEMDQYF 
VEIMVDQIGRGNKTGNAFSKQAWIDMLVLFNARFSGQYGKRVLRHRYNKLLKYYKDMEAI 
LKEDGFSWDETRLMISADDAVWDSYIKDHPLARTYRMKSLPSYNDLDTIFACQAEQGTDH 
RDDGSAAQTSETKASQEQNSDRTRIFWTPPMDYHLIDLLVEQVNNGNRVGQTFITSAWNE 
MVTAFNAKFGSQHNKDVLKNRYKHLRRLYNDIKFLLEQNGFSWDARRDMVIADDDIWNTY 
IQAHPEARSYRVKTIPSYPNLCFIFGKETSDGRYTRLAQAFDPSPAETVRMNESGSTDGF 
KDTRSFQKVVYTSNEKNDYPCSNIGPPCIEWTRVMDHCLIDLMLEQVSRGNKIGETFTEQ 
AWADMAESFNAKFGLQTDMFMLENRYILLMKERDDINNILNLDGFTWDVEKQTIVAEDEY 
WEAYIKEHPDATIYKGKTLDSYGNLCKLNEHLSQESFNCENLMIELENYGNEMEIVDDFS 
SPHKQQNKRPNPITPPLGIVVCKAQKTGVETRKPLCETEGDDDDCTKPMPQIEIYSRIGN 
ALDALQALPDMDDELLLDACDLLEDERKAKTFLALDVSLRRKWLVRKLRPSANV*>AT2G24960.2 |  unknown protein 
MSNQTTCNDRTRTYWTPTMERFFIDLMLEHLHRGNRTGHTFNKQAWNEMLTVFNSKFGSQ 
YDKDVLKSRYTNLWKQYNDVKCLLDHGGFVWDQTHQTVIGDDSLWSLYLKAHPEARVYKT 
KPVLNFSDLCLIYGYTVADGRYSMSSHDLEIEDEINGESVVLSGKESSKTEWTLEMDQYF 
VEIMVDQIGRGNKTGNAFSKQAWIDMLVLFNARFSGQYGKRVLRHRYNKLLKYYKDMEAI 
LKEDGFSWDETRLMISADDAVWDSYIKDHPLARTYRMKSLPSYNDLDTIFACQAEQGTDH 
RDDGSAAQTSETKASQEQNSDRTRIFWTPPMDYHLIDLLVEQVNNGNRVGQTFITSAWNE 
MVTAFNAKFGSQHNKDVLKNRYKHLRRLYNDIKFLLEQNGFSWDARRDMVIADDDIWNTY 
IQAHPEARSYRVKTIPSYPNLCFIFGKETSDGRYTRLAQAFDPSPAETVRMNESGSTDGF 
KDTRSFQKVVYTSNEKNDYPCSNIGPPCIEWTRVMDHCLIDLMLEQVSRGNKIGETFTEQ 
AWADMAESFNAKFGLQTDMFMLENRYILLMKERDDINNILNLDGFTWDVEKQTIVAEDEY 
WEAYIKEHPDATIYKGKTLDSYGNLCKLNEHLSQESFNCENLMIELENYGNEMEIVDDFS 
SPHKQQNKRPNPITPPLGIVVCKAQKTGVETRKPLCETEGDDDDCTKPMPQIEIYSRIGN 
ALDALQALPDMDDELLLDACDLLEDERKAKTFLALDVSLRRKWLVRKLRPSANV*>AT4G10130.1 |  DNAJ heat shock N-terminal domain-containing protein 
MLVGENCVHETYYEILSVKEDASYEEIRNSYRSAILHSHPDKLNNTSRSSSDDEKFLKIQ 
KAWEVLSDAELRVVYDNDLRSSRHDGITADEISIEDMSVEITGDVIDLFYQCRCGDYFCV 
DSSELGTMGFALLRDGDFVYVKRLGAFVASVVLPCGSCSLKTRVWVDSDMKIPI*>AT4G29580.1 |  cytidine deaminase putative / cytidine aminohydrolase putative 
MAQPPNPYAALTPTEAESSGPFEPETLLPLINRALPLAQALPSQSPLVAVGRGSSGRTFL 
GVNVELPGLSPLHSIHAGQFLVVHLALNNERTLNCLAFSSNGSYFDPPCPHCCQLLQEIR 
NASSTKLLITDPSRQRDMSLSTYLPQKYLSLYNEVPKYFFARLLDENRNNGLTLINPNPI 
RDCLDSEICNHLSCRALKAANRSYAPYSKSPSGVALMDFQGRVYSGWSIESVANPILGAA 
QAALVDFMTNGGGHEFNNIVRGFLVEKRDAKLSHLATAREILNKVAHFSFILRVLHCQ*>AT4G29580.1 |  cytidine deaminase putative / cytidine aminohydrolase putative 
MAQPPNPYAALTPTEAESSGPFEPETLLPLINRALPLAQALPSQSPLVAVGRGSSGRTFL 
GVNVELPGLSPLHSIHAGQFLVVHLALNNERTLNCLAFSSNGSYFDPPCPHCCQLLQEIR 
NASSTKLLITDPSRQRDMSLSTYLPQKYLSLYNEVPKYFFARLLDENRNNGLTLINPNPI 
RDCLDSEICNHLSCRALKAANRSYAPYSKSPSGVALMDFQGRVYSGWSIESVANPILGAA 
QAALVDFMTNGGGHEFNNIVRGFLVEKRDAKLSHLATAREILNKVAHFSFILRVLHCQ*>AT4G29580.2 |  cytidine deaminase putative / cytidine aminohydrolase putative 
MAQPPNPYAALTPTEAESSGPFEPETLLPLINRALPLAQALPSQSPLVAVGRGSSGRTFL 
GVNVELPGLSPLHSIHAGQFLVVHLALNNERTLNCLAFSSNGSYFDPPCPHCCQLLQEIR 
NASSTKLLITDPSRQRDMSLSTYLPQKYLSLYNEVPKYFFARLLDENRNNGLTLINPNPI 
RDCLDSEICNHLSCRALKAANRSYAPYSKSPSGVALMDFQGRVYSGWSIESVANPILGAA 
QAALVDFMTNGGGHEFNNIVRGFLVEKRDAKLSHLATAREILNKVAHFSFILRVLHCHKI 
QCFFTHESPSMSEKEDFANILKDINSKRRRNIHHGTIYKTGDEKTLKFILGVNYKDMEAV 
DEPPMRKRKVDELMHAVDPSNDSRFTFQTRVTRATCQKDEDLRILTEVCRIKPKIQGTGE 
QSDGMTKLLMVSTKAIYLSGYRMIF*>AT4G29580.2 |  cytidine deaminase putative / cytidine aminohydrolase putative 
MAQPPNPYAALTPTEAESSGPFEPETLLPLINRALPLAQALPSQSPLVAVGRGSSGRTFL 
GVNVELPGLSPLHSIHAGQFLVVHLALNNERTLNCLAFSSNGSYFDPPCPHCCQLLQEIR 
NASSTKLLITDPSRQRDMSLSTYLPQKYLSLYNEVPKYFFARLLDENRNNGLTLINPNPI 
RDCLDSEICNHLSCRALKAANRSYAPYSKSPSGVALMDFQGRVYSGWSIESVANPILGAA 
QAALVDFMTNGGGHEFNNIVRGFLVEKRDAKLSHLATAREILNKVAHFSFILRVLHCHKI 
QCFFTHESPSMSEKEDFANILKDINSKRRRNIHHGTIYKTGDEKTLKFILGVNYKDMEAV 
DEPPMRKRKVDELMHAVDPSNDSRFTFQTRVTRATCQKDEDLRILTEVCRIKPKIQGTGE 
QSDGMTKLLMVSTKAIYLSGYRMIF*