Gene list
Applied filters:
COG category: Extracellular structures
Gene type: CDS
Genomic element: chromosome
Number of genes found: 8
![]() | ||||||
Show UniProt / TrEMBL protein name | ![]() |
View in Fasta format (DNA) | ![]() |
View as list | ![]() |
|
![]() |
# Escherichia coli O157:H7 str. Sakai, Sakai >ECs5290 putative invasin MARGWASSEASGAMTDWLNNFGTARISLGVDEDFSLKNSQFDFLHPWYDT PDYLLFSQHTLHRTDDRTQINTGLGWRHFTSSWMSGINLFFDHDLSRYHS RAGLGAEYWRDYLKLSSNAYIGLTGWRSAPELDNDFEARPANGWDLRAEG WLPAWPQLGGKLVYEQYYGDEVALFDKNDRQSNPHAITAGLNYTPFPLLT LSAEQRQGKQGENDTRFAVDLTWQPSSSMQKQLNPDEVAGRRSLAGSRYD LIDRNNNIVLEYRKKELIRLSLLDPVKGKSGEIKPLVSSLQTKYALKGYN IEAAALEAAGGKVSTSGKDITVTLPGYRFTNTPETDNTWSIDVTAEDVKG NLSRHEQSMVVIQAPTLSQKDSLLSVNPLTVAADKKSTTTLTVTAHDSDG TPVPGLALQTRSEGVQDITLSDWTDNGDGSYTQILTAGTTSGSVTLTPQI NGESAVKESIVVNIVPVVSSRDHSSITIDNVSYYAGDDIKVRVELKDDSN QPVAYQKEELVKAVTVENSKPGATIVWHEEQPGVYAANYPAYKQGTALRA QLSLHNWNAPLQSHIYNIEANQNKARVATLSATNNDVYADKKTFNTLTIN VTDESDNPLTNHQVTFKNEKGSAEFVEPPQQNTDAYGVATINMVSQVAEE NTISATLPNGFSQRIIAKFVSDSSTPKFKQLVADPDTIIAGNSQGSTLTA IITDFHNNPLKDMKVNFVAPGGSQLDNTTATTDQSGIVRVHLTSSKAGSY SVDASLEVDKNIHQSVTITVVPNREQSVMTLNAGSGSAIANNTNIVTLTA SVKDVYGHPLPDEDVKFTLPASMTGNFTLSSETARTDANGDAVVTLRGTK AGEFTVTATLTRNNTVAYQQVTFIGDTNSAQLQPLTASLNSIVAGNSTGS TLTATILDAYQNPLKDQLVTFQSNDVTLSETEVTTNTLGQATVTMTSNIA GQHNVVVSRKAQASDNKTFSLSVLPDESSAKVISITGAEKTITVGENITL RILVQDAFNNVIAGQRVRLSAQPTTNITIGDTAYTDNNGYAYVNLLSTQP GVYQVTATLDNNSSSKVDVNVANGKLELTSSKPETTVHNSEGITLTATAR NARGELMPGQIITFSVTPEGATLSNTGEVLTDQSGQAKVTLTSDKVNVYT VTAIMGKDVPVQSQVTVAVKADAKTAHVVSVVASPDTITADGIDSSTITS RVEDDYGFPVEGVDISHGLDTKGSPVVNIPTTRTDQSGQVTATITSTLAE TLTVNVQVPGTANQSATITLVAGTADESKSILKSDVDTLKADYQQSAKLT LTLQDKYGNPIVTSDHLEFVQSGPFVNFLKLSDIDYSQRNYGEYTVTVTG GKEGTATLIPMLNGVHQANLSISLNLIQSIKEMSGHVTANNHTFSTAKFP SEGFAGAYYTLNNDNFEAGKTVDDYMFSSSQGWVSVDASGKVSFANIGDQ TSVTISAVPRQGGTTYQTLIKLKGWWVNNGNHTNIWLAANALCHAKNDGY NLPGITHLTSGENKRTQGSLYGEWGNVGAFSSNSQFTPGAYWTSESDDYS RHYYVQMLTGMTGSDADSSPQLTACRKSL >ECs4480 hypothetical protein MNKIFKVIWNPATGNYTVTSETAKSRGKKSGRSKLLISALVAGGMLSSFG ALANAGNDNGQGVDYGSGSAGDGWVAIGKGAKANTFMNTSGSSTAVGYDA IAEGQYSSAIGSKTHAIGGASMAFGVSAISEGDRSIALGASSYSLGQYSM ALGRYSKALGKLSIAMGDSSKAEGANAIALGNATKATEIMSIALGDTANA SKAYSMALGASSVASEENAIAIGAETEAAENATAIGNNAKAKGTNSMAMG FGSLADKVNTIALGNGSQALADNAIAIGQGNKADGVDAIALGNGSQSRGL NTIALGTASNATGDKSLALGSNSSANGINSVALGADSIADLDNTVSVGNS SLKRKIVNVKNGAIKSDSYDAINGSQLYAISDSVAKRLGGGAAVDVDDGT VTAPTYNLKNGSKNNVGAALAVLDENTLQWDQTKGKYSAAHGTSSPTASV ITDVADGTISASSKDAVNGSQLKATNDDVEANTANIATNTSNIATNTANI ATNTTNITNLTDSVGDLQADALLWNETKKAFSAAHGQDTTSKITNVKDAD LTADSTDAVNGSQLKTTNDAVATNTTNIANNTSNIATNTTNISNLTETVT NLGEDALKWDKDNGVFTAAHGTETTSKITNVKDGDLTTGSTDAVNGSQLK TTNDAVATNTTNIATNTTNISNLTETVTNLGEDALKWDKDNGVFTAAHGN NTASKITNILDGTVTATSSDAINGSQLYDLSSNIATYFGGNASVNTDGVF TGPTYKIGETNYYNVGDALAAINSSFSTSLGDALLWDATAGKFSAKHGTN GDASVITDVADGEISDSSSDAVNGSQLHGVSSYVVDALGGGAEVNADGTI TAPTYTIANADYDNVGDALNAIDTTLDDALLWDADAGENGAFSAAHGKDK TASVITNVANGAISAASSDAINGSQLYTTNKYIADALGGDAEVNADGTIT APTYTIANAEYNNVGDALDALDDNALLWDETANGGAGAYNASHDGKASII TNVANGSISEDSTDAVNGSQLNATNMMIEQNTQIINQLAGNTDATYIQEN GAGINYVRTNDDGLAFNDASAQGVGATAIGYNSVAKGDSSVAIGQGSYSD VDTGIALGSSSVSSRVIAKGSRDTSITENGVVIGYDTTDGELLGALSIGD DGKYRQIINVADGSEAHDAVTVRQLQNAIGAVATTPTKYFHANSTEEDSL AVGTDSLAMGAKTIVNGDKGIGIGYGAYVDANALNGIAIGSNAQVIHVNS IAIGNGSTTTRGAQTNYTAYNMDAPQNSVGEFSVGSADGQRQITNVAAGS ADTDAVNVGQLKVTDAQVSQNTQSITNLDNRVTNLDSRVTNIENGIGDIV TTGSTKYFKTNTDGVDASAQGKDSVAIGSGSIAAADNSVALGTGSVATEE NTISVGSSTNQRRITNVAAGKNATDAVNVAQLKSSEAGGVRYDTKADGSI DYSNITLGGGNGGTTRISNVSAGVNNNDVVNYAQLKQSVQETKQYTDQRM VEMDNKLSKTESKLSGGIASAMAMTGLPQAYTPGASMASIGGGTYNGESA VALGVSMVSANGRWVYKLQGSTNSQGEYSAALGAGIQW >ECs2775 hypothetical protein MLARSGKVSMATKKRSGEEINDRQILCGMGIKLRRLTAGICLITQLVFPM AAAAQGVVNAATQQPVPAQIAIANANTVPYTLGALESAQSVAERFGISVA ELRKLNQFRTFARGFDNVRQGDELDVPAQVSENNLTPPPGNSSGNLEQQI ASTSQQIGSLLAEDMNSEQAANMARGWASSQASGAMTDWLSRFGTARITL GVDEDFSLKNSQFDFLHPWYETPDNLFFSQHTLHRTDERTQINNGLGWRH FTPTWMSGINFFFDHDLSRYHSRAGIGAEYWRDYLKLSSNGYLRLTNWRS APELDNDYEARPANGWDVRAEGWLPAWPHLGGKLVYEQYYGDEVALFDKD DRQSNPHAITAGLNYTPFPLMTFSAEQRQGKQGENDTRFAVDFTWQPGSA MQKQLDPNEVDARRSLAGSRFDLVDRNNNIVLEYRKKELVRLTLTDPVTG KSGEVKSLVSSLQTKYALKGYNVEATALEAAGGKVVTTGKDILVTLPAYR FTSTPETDNTWPIEVTAEDVKGNFSNREQSMVVVQAPTLSQKDSSVSLSS QTLSADSHSTATLTFIAHDAAGNPVIGLVLSTRHEGVQDITLSDWKDNGD GSYTQILTTGAMSGTLTLMPQLNGVDAAKAPAVVNIISVSSSRTHSSIKI DKDRYLSGNPIEVTVELRDENDKPVKEQKQQLNTAVSIDNVKPGVTTDWK ETADGVYKATYTAYTKGSGLTAKLLMQNWNEDLHTAGFIIDANPQSAKIA TLSASNNGVLANENAANTVSVNVADEGSNPINDHTVTFAVLSGSATSFNN QNTAKTDVNGLATFDLKSSKQEDNTVEVTLENGVKQTLIVSFVGDSSTAQ VDLQKSKNEVVADGNDSATMTATVRDAKGNLLNDVKVTFNVNSAAAKLSQ TEVNSHDGIATATLTSLKNGDYTVTASVSSGSQANQQVIFIGDQSTAALT LSVPSGDITVTNTAPLHMTATLQDKNGNPLKDKEITFSVPNDVASRFSIS NSGKGMTDSNGTAIASLTGTLAGTHMITARLANSNVSDTQPMTFVADKDR AVVVLQTSKAEIIGNGVDETTLTATVKDPFDNVVKNLSVVFRTSPADTQL SLNARNTNENGIAEVTLKGTVLGVHTAEAILLNGNRDTKIVNIAPDASNA QVTLNIPAQQVVTNNSDSVQLTATVKDPSNHPVAGITVNFTMPQDVAANF TLENNGIAITQANGEAHVTLKGKKAGTHTVTATLGNNNASDAQPVTFVAD KDSAVVVLQTSKAEIIGNGVDETTLTATVKDPFDNAVKDLQVTFSTNPAD TQLSQSKSNTNDSGVAEVTFKGTGFGCSYSRSHTA >ECs0541 hypothetical protein MSLIIDVISRKTSVKQTLINPGDVTVVIYEPSVVQVHAQASAVARYVREG NDLLIYMQDGTVIRCNGYFLQAANTAEQSELVFADGQQLTHITFADTAAG GLAPVELTAQTTAIESIAPFLDTVAQTSAFPWGWLAGAAVGGGALGALLA SGGDGDSKTEVINNPTPPAEPGNATPSFLVTDNQGDQRGILATNDITDDT TPTFSGSGQAGATIQIKDSNGNTIASTQVDNNGHWSVSLPTQSAGEHTWS VVQIVGSTITDAGSITLTIDNSQASVQVATTAGDNIINASEQAAGFTLSG TSSHLAQGTELTVTLNGKTYTTSVGANGAWSVQVPTADAQALGEGNQAVL VSGKDATGNTVTGAQLLTVDTQPPTLAINTIAQDNIISAAEHNVALVLSG TSNAEAGQTVTLTVNGKSHTATVGSDGTWQVTLPATEVQALAEGNYAVNA SVSDRAGNTTSHSANFTVDTSAPVVSVNTVAGDDILNNAEQAVAQIISGQ VSGASPGDTVTVKLGTHVLTGIVLADGSWNVALDPAVTRTLDRGANTIFV TVTDAAGNTGAASRAITLVGVSPLITINTVSGDDIISGAEKGAPLTLTGS TQQAETGQTVTVTLAGQSFTTTVQADGSWSLTVPAAAMGNLPDGAVAITA SVTDLSGNTGNTSRTITVDSQAPALSIDPLTADNIINAAESGQDLPITGT TDAQPGQTVTVTLNGQTYQGVVQPDGTWSVTVPAANVGALADGNATVTAS VNDVAGNPSSVSRVALVDATPPVVTINPVATDNVINTPEHAQAQIISGTV TGAQAGDIVTVTLNNVDYTTVVDGSGNWSLGVPASVVSGLADGSYPVSVS VTDKAGNTGSQSLTVTVNTAAPLIGINSIAGDDVINASEKGADLQITGTS DQPVNTAITVTLNGQNYTTTTDASGNWSVTVPASAVTALGQANYTVTAAV TSDIGNSATASHNVLVDSALPGVTINPVATDDIINAAEAGVAQTISGQVT GAEDGDTVTITLGGNTYTATVGSNLTWSVDVPAADIQALGNGDLTVNASV TNQNGNTGSGTRDITIDANLPGLRVDTVAGDDVVNIIEHGQALVVTGSSS GLAESTPLTVTINNVEYTTAVQADGSWSVGVTAAQVSAWPAGTVNIAVSG ESSAGNSVSITHPVTVDLTPAAITINTIATDDVINAAEKGADLTLSGTTT NVEPGQTVTVTFGGKNYTASVASDGSWTATVPAADLASLPEGSASALASV SNINGNSASAVHNYSVDSSAPTIIINTVASDNIVNASEADAGVTVSGSTT AEAGQIVTITLNSPTVQTYQATVQADGSWSINIPAADLEALTDGSHTLTA TVNDKAGNPASTTHNLAVDLTVPVLTINTIAGDDIINATEHGQALVISGS STGGEAGDVVTVTLNSKTYTTTLDASGNWSVGVPAADVTALGSGPQTVTA TVTDAAGNSDN >ECs0548 adhesin/invasin-like protein MKTVNVALLALIISATSSPVVLAGDTIEAAATELSAINSGMSQSEIEQKI TRFLERTDNSPAAYTYLTEHHYIPSETPDTTQTPTVQTDPDAGQKTVAAT GDVQTTARYQSMINARQSAVTDAQQTQITEQQAQIVATQKTLAATGDTQN TAHYQEMINARLAAQNEANQRTATEQGQKMNALTTDVAVQQQNERTQYDK QMQSLAQESAQAHEQIDSLSQDVTQTHQQLTNTQKRVADNSQQINTLNNH FSSLKNEVDDNRKEANAGTASAIAIASQPQVKTGDVMMVSAGAGTFNGES AVSVGTSFNAGTHTVLKAGISADTQSDFGAGVGVGYSF >ECs0542 hypothetical protein MPASAVGALGEASYTVTANVTDSAGNSNSASHNVQVNTALPGVTINPVAT DDIINAAESGNAQTISGQVTGAAAGDTVTVTLGGKTYTATVQGNLSWSVD VPAADIQAIGNGNLTVNASVTNGVGNTGSGSRDITIDANLPGLRVDTVAG DDVVNSIEHAQALVITGSSSGLAAGAALTVVINTVTYAATVLADGTWSVG VPAADVSNWPAGTVNITVSGTNTAGTTSTITHPVTVDLAAVAISINTVSG DDVINAAEKGADLTLSGSTSGVEVGQTVTVTFGGKTYTATVAGDGSWTTT VPAADLSVLRDGDATVQASVSTINGNTASATHAYSVDATAPTLAINTIAT DDILNAAEAGNPLTISGSSTAEAGQTVTVTLNGVTYSGSVQADGSWSVSL PTADLSNLTASQYTVSASVSDKAGNPASANHGLAVDLTVPVLTINTVSGD DIINAAEHGQALVISGSSTGGEAGDVITVTLNSKTYTTMLDASGNWSVGV PAADVTALGSGPQTITAAITDAAGNSDDASRTVTVNLAAPTIGINTIATD DVIKATEKGADLQITGTSNQPAGTTITVTLNGQNYTATTDSNGNWSATVP ASAVSALGEANYTVTANVTDTAGNSNSASHNVLVNSALPAVTINAVATDD IINAAESGNAQTISGQVTGAAQGDTVTVTLGGNTYTATVQSNLSWSVDVP AADIQALGNGDLTVNASVTNGVGNTGSGSRDITIDANLPGLRVDTVAGDD VINSIEHNQALVITGSSSGLTAGTALTVEINNVTYGATVLADGTWSLGVP AVDVSNWPAGTVNITVSGTNSAGTTSTITHPVTVDLAGVAITINTLSGDD VINAVEKGETLVVSGSTSGVEAGQTVTVTFGGKNYTTTVEANGSWTVNVP PADLAALPDGAGNVQASVSNINGNSAQADRAYSVDATAPLVTINTIASDD ILNVSEAGAGITISGTTTAQAGQTLTVTLNNNTYQTTVLADGTWSVNVPA ADLSGLTASSYTVTATVSDKAGNPASADHALVVDITAPDLTINTVAGDDI INAIEHGQALVVSGTSTGAAAGDVVTVTLNGKNYTTTLDASGNWSVGIPA ADVTALATGSQTITASLSDRAGNSDSTTHDVTVDLSGPTLTINTVSGDDI INAAEIVVAQTISGQVTGTAVAGNTVIVTIGGNQYNATVQSDLSWSVSVP ANVLQALGNGELTISASLTNSANNTGTATHDIVIDANLPGLRVDTVAGDD VINSIEHTQALVITGSSSGLAAGAALTVVINSVTYGATVLADGSWSVGVP VADVTNWPAGTVNIAVSGTNTAGTTTSISHPVTVDLAAVAITINTLSTDD VINAAEKGSDLQLSGTTSGVEAGQTITVIFGGKSYTTTVAADNTWGLTIP AVDVATLPDGAANVQASVSNVAGNSTQATHAYSVDATAPSVTINTIATDD ILNAAEAGSALTISGTSTAEAGQTVTVTLNGVNYSGNVQADGSWSVSVPT GDLASLTASSYTVNASVSDKARNSASATHNLTVDLAAPVVTINTVAGDDI INATEHGQAQIISGSATGATTGNTVSVTIGTTTYTTVLDANGNWSIGVPA SVISALAQGDVTITATVTDSAGNSGTASHTVTVALGAPVLAINTIAVDDI INAAEKGADLAITGTSNQPAGTQITVTLNGQNYTTTADASGNWSVTVPAS RVSALGEATYTVTAAATDADGNSGSASHNVQVNTALPGVTINVVATDDII NAAEAGVEQTISGQVTGAAAGDTVTVTLGGATYTATVQANLSWSVDVPAS ALQELGNGELTISASVTNSVGNTGNGTREITIDANLPGLRVDTVAGDDVV NIIEHGQALVITGSSSGLAAGSNVTLTINGQTYVAAVLADGTWSVGVPAV DVSAWPAGSVTIAASGSTSAGNPVSVTHPVTVDLSAVAVSINAITADDVI NAAEKGAALTLSGSTSGVEAGQTVTVTFGGKTYSATVAANGSWSTSVPAA DMAALRDGDASAQASVSNVNGNSATTTHAYSVDASAPTVTINTIAGDDIL NAAEAGAALTITGSSTAEAGQTVTVTLNGTNYTGTVQTDGSWSVSVPSAD LSTLTASNYTVNAAVSDKAGNPASVNHNLTVDTSVPVVTINTVAGDDVIN ATEHAQAQIISGSATGAATGSTVTVTIGTNTFTTVLDASGNWSVGVPASV VSALANGTVTINASVTDAGGNSGSATHQVTVNTGLPTITFNAISGDNILN ADEKGQPLTISGGSTGLATGAQVTVTLNGHNYSATTDASGNWTLTVPVSD LAALGQANYTVSASATSAAGNTASSQANLLVDSGLPDVTINTVAGDDIIN AAEAGADQTISGVVTRAAAGDTVTVTLGGNTYTATVQSNLSWSVSVPTAD LQALGNGDLTITASVTNANGNTGSGTRDITIDANLPGLRVDTVAGDDIVN SIEHGQALVITGGSSGLNAGAVLTVTINSVAYSATVQADGSWSVGIPAAN VSAWPAGPLTVEVDGQSSANNPVSVSHPFTVDLTAVAISINTVASDDVIN AAEKGTNLTLSGSTSGIESGQTVTVTFGGKTYTASVAANGSWSVNVPAAD LATLPEGAANVQASVSSASGNSASATHAYSVDASAPTLTINTIASDDILN AAEAGSPLTISGTSTAETGQTVTVTLNGATYTGTVQADGSWSVSVPTSAL GALNASNYTVSATVNDKAGNPGSASHNLAVDTTAPVLTINTVAGDDIIND AEHAQALVISGTSSGGEAGDVVSVVLNGKTYTTTLDASGNWSVGVPAADV TALGSGAQTITASVSDRAGNSDDASRTVTVSLSAPVISINTIAGDDVINA TEKGSDLALSGTSDQPAGTAITVTLNGQNYSATTDASGNWSVTVPASAVS ALGEATYSVTASVTNAQGNSSTASHNVQVNTALPGITINPVATDDIINAS EAGSAQTISGQVTGAAAGSTVTVELGGKTYTATVQADLSWNVSVPAADWQ ALGNGELTVNASVTNAVGNTGSGTRDITIDASLPGLRVDTVAGDDVVNII EHAQAQVITGSSSGFAAGTALTVVINNQTYAATVLANGSWSVGVPATDVS NWPAGTLNITVSGANSAGTQTSITHPLTVDLTAVAISMNSITSDDAINAA EKGAALTLSGSTSGVEAGQTVTVTFGGKTYTTTVAANGSWSTTVPAADLA ALRDGDASAQVRVTNVNGNSATATHEYSVDSAAPTVTINTIASDNIINAS EAAAGVTVSGTSTAQTGQTLTVTLNGTNYQTTVQTDGSWSLTLPASDLTA LANNGYTLTATVSDLAGNLGSASKGVTVDTTAPVISFNTVAGDDVINNVE HIQAQIISGTATGAVAGDRLVVTIAGQQYVTSTDASGNWSVGVPASVISG LADGTVTISATITDSAGNSSTQTHNVQVNTAAVSLSVSTISGDNLINAAE AGSALTLSGTGTNFATGTVVTVLLNGKGYSATIQSNGSWSVNVPAADVAA LSDGTSYTVSASAQDSAGNGNSSTQTHNVQVNTAAVSLSVSTISGDNLIN AAEAGSALTLSGTGTNFATGTVVTVLLNGKGYSATIQSNGSWSVNVPAAD VAALSDGTSYTVSASAQDSAGNSATASRSVAVDLTAPVISINTVSTDDRL NAAEQQQPLTLNGSTSAEVGQTVTVTFGGKTYTATVAANGTWALNVPAVD LAALGQGAQTITASVNDRAGNPGQATHALTVDTVAPTVTIATVAGDDIIN NAEQLAGQTISGTTTAEVGQTVTVTFNGQTWSATVGSGGSWSVFIPAQQF AGLSDGSYTISATVSDQAGNPGSASRGVTLNGDVPTVTINTFAGDDVVNA AEHGSSLVISGTTTAPVGQTLTLTLNGKTYTTTVQTGGSWSYTLGSADVT ALADGNAYVINASVSNAIGNTGSSNHTITVDLSAPAMGINIDSLQADTGL SASDFITSVSPVVVNGSLTAALASNETAQISIDGGTTWTTLTVTGTTWRY NDSRTLTDGNYLYQVRVIDAAGNVGATDSQNVVIDTTAPDPAVKTIAISA ITTDMGLITNDFVTSDTTLAVSGTLGATLSAGEFAQISLDGGVTWTTLTV VGTSWSYADGHTLTDGTWNYTVRVVDLAGNVGQTATQNVVVDTTSPEAAK SITITGISDDTGTSSSDFITSDTTLTVRGVLGAALGANEFAQISTDNGAT WVNVTVAADSLNWSYVDGRTLTNGTTTWQVRVVDLAGNVGATSSQSALID TVNPAQVLTIASISTDTGSSATDFITSDTMLTLTGSLGAGLASGEVAQIS LDSGATWTTLTTNGTQWTYTDSRTLTDGSYVYQVRVLDLAGNTGPVVSKT VVVDTINPTATPTIVSYTDDVGQRQGTLSSSQATDDTTPLLNGVLSAPLA SGEVVYLYRNGLLLGAVTMVGALNWTYSDSGLVSGAYTYSARVVDLAGNI TSSSDFVLTVDTSIPTTLAQITSQTTRDTTPIISGVITAALASGQYVEVV INGKTYTSEPGGAVVVDPAHNTWYVQLPDTDALTVSATAYTVTAQVKSSA GNGNNANISNGTVTVNAAIDYTPTWTTASKTTAWGLTYGLDSHGMWTVLA NQQVMQSTDPLTWSKTALTLYQSGNNYATSSIADYDRNGTGDLFITRDDY GTGYINGFTNNGDGTFSSAIQVTVGTLTWYGSIVAFDKEGDGYLDFWIGD AGGPDSNTFLWNNAGTLVGNSTTSNSGGSATVGGAVTGYLSLNEGSGVDL NNDGRIDLVQHTYNLNNYYTLSSLINQGNGTFVWGQNTTNTFLSGAGSGA MSSSVSMTWADFDGDGDMDLFLPASQGRANYGSLLFNTNGVLGCPVAVGA TATTYASQFSLAVDWNHDGLMDIARIAQTGQSYLYTNVSNASNWTQSALG GSQSGTTSGVAAMDYDWDGAVDVLVSKQSGSVFLSRNTNTVSYGTSLHLR ITDPNGINVYYGNTVKLYNSAGVLVATQIINPQSGMGVNDTSALVNFYGL NAGETYNAVLIKSTGTTASNIDQTVNTSWGGLQATDATHAYDLSAEAGTA SNNGKFVGTGYNDTFFATAGTDTYDGSGGWVYSSGTGTWLANGGMDVVDF RLSTVGVTANLSSTAAQATGFNTSTFTNIEGISGSNFNDILTGSSGDNQL EGRGGNDTLNIGNGGHDTLLYKLLNASDATGGNGSDVVNGFTVGTWEGTA DTDRIDIRELLQGSGYTGNGKASYVNGVATLDAQAGNIGDFVKVTQSGSD TIVQIDRDGTGGTFATTNVVTLTGVHTDLATLLANHQLMVV >ECs2117 hypothetical protein MNRIYRVIWNCTLQVFQACSELTRRVGKTSTVNLRKSSGLTTKFSRLTLG VLLALSGSVSGASLEVDNGQITNIDTDVAYDAYLVGWYGTGVLNILAGGN ASLTTITTSVIGGNEDSEGTVNVLGGTWRLYDSGNNARPLNVGQSGTGTL NIKQKGHVDGGYLRLGTQAAGVGTVNVEGEDSVLTTELFEIGSYGTGSLN ITDKGYVTSSIVAILGYQANSNGKVVVEKGGEWLIKNNDSSIEFQIGNQG TGEATIREGGLITAENTIIGGNATGVGTLNVQDQDSVITVRRLYNGYFGN GAVNISNNGLINNKEYSLVGVQDGSHGVVNVTDKGHWNFLGTGEAFRYIY IGDAGDGELNVSREGKVDSGIITAGMKETGTGNLTVKDKNSVITNLGTNL GYDGHGEMNISNEGLVVSNGGSSLGYGETGVGKVSITTGGIWEVNKNVYT TIGVAGVGNLNISDGGKFVSQNITFLGDKASGIGTLNLMDATSSFDTVGI NVGNFGSGIVNVSNGATLNSTGYGFIGGNASGKGIVNISTDSLWNLKTSS TNAQLLQVGVLGTGELNITTGGIVKARDTQIALNDKSKGDVRVDGQNSLL ETFNMYVGTSGTGTLTLTNSGTLNVEGGEVYLGVFEPAVGTLNIGAAHGE AAADAGFITNATKVEFGSGEGVFVFNHTNNSDAGYQVDMLITGDDKDGKV IHDAGHTVFNAGNTYSGKTLVNDGLLTIASHTADGVTGMGSSEVTIASPG TLDILASTNSAGDYTLTNALKGDGLMRVQLSSSDKMFGFTHATGTEFAGV AQLKDSTFTLERDNTAALTHAMLQSDIENTTSVNVGEQSIGGLAMNGGTL IFDTDIPAATLAEGYISVDTLVVGASDYTWKGRNYQVNGTGDVLIGVPKP WNDPMANNPLTTLNLLEHDDNHVGVQLVKAQTVIGSGGSLTLRDLQGDEV EADKTLHIAQNGTVVAEGDYGFRLTTAPGDGLYVNYGLKALNIHGGQKLT LAEHGGAYGATADMSAKIGGEGDLAINTVRQVSLSNGQNDYQGATYVQMG TLRTDADGALGNTRELNISNAAIVDLNGSTQTVETFTGQMGSTVLFKEGS LTVNKGGISQGELTGGGNLNVTGGTLAVEGLNARYNALTSVSPNAEVSLD NTQGLGRGNIANDGLLTLKNVTGELRNSISGKGIVSATARTDVELDGDNS RFVGQFNIDTGSALSVNEQKNLGDASVINNGLLTISTERSWAMTHSISGS GDLTKLGTGILTLNNDSSAYQGTTDIVGGEIAFGSDSAINTASQHINIHN SGVMSGNVTTAGDVNVMSGGTLRVAKTTIGESAATWRMAARFK >ECs0350 putative adhesin MKNSKAFYRSALATAIVMALSAPAFAADNAVSTDSVTLNKDKTTLDQDVV ISNTADKQITAVTINAADEDLNVAFAGHDITAESTADKKFVEGVKVSGNK NVVINATDSTITAQGEGTYVRTAMVIDSTGDVVVNGGNFVAKNEKGSATG ISLEGAKGNNVTLNGTTINAQGNKSSSNASTAIFAQKGSLLNSFEGDATD NITLAGSNIINGRIETIVTAGNKTGIHTVNLNIKDGSVIGAANNKQTIYA SASAQGTGSATQNLNLSVADSTIYSDVLALSESENSAATTTNVNMNVARS YWEGNAYTFNSGDKAGSNLDINLSDSSVWKGKVSGAGNASVSLQNESVWN VTGSSTVDALAPSG