InterPro

InterPro é unha base de datos de familias de proteínas, dominios e sitios funcionais de proteínas nos cales se encontran características identificables de proteínas coñecidas, que poden ser aplicadas a novas secuencias de proteínas[1] para así caracterizalas funcionalmente.[2][3]

Os contidos de InterPro constan de sinaturas diagnóstico e as proteínas coas cales estas se corresponden significativamente. As sinaturas constan de modelos (tipos simples, como expresións regulares ou tipos máis complexos, como modelos de Markov ocultos), que describen familias de proteínas, dominios e sitios. Os modelos constrúense a partir de secuencias de aminoácidos de familias coñecidas ou dominios e úsanse seguidamente para buscar secuencias descoñecidas (como as que se descobren a partir de novas secuenciacións de xenomas) para así clasificalas. Cada unha das bases de datos que están incluídas en InterPro contribúen a un nicho de información diferente, desde clasificacións baseadas na estrutura de alto nivel (SUPERFAMILY e CATH-Gene3D) ata clasificacións de subfamilias bastante específicas (PRINTS e PANTHER).

A intención de InterPro é proporcionar un centro multiservizos para a clasificación de proteínas, na que todas as sinaturas producidas polas diferentes bases de datos membros están situadas en entradas na base de datos InterPro. As sinaturas que representan dominios eqivalentes, sitios ou familias póñense na mesma entrada e as entradas poden tamén estar relacionadas unhas con outras. Tamén se proporciona cando é posible información adicional como a descrición, nomes consistentes e termos de Gene Ontology (GO) que están asociados con cada entrada.

  1. Hunter, S.; Jones, P.; Mitchell, A.; Apweiler, R.; Attwood, T. K.; Bateman, A.; Bernard, T.; Binns, D.; Bork, P.; Burge, S.; De Castro, E.; Coggill, P.; Corbett, M.; Das, U.; Daugherty, L.; Duquenne, L.; Finn, R. D.; Fraser, M.; Gough, J.; Haft, D.; Hulo, N.; Kahn, D.; Kelly, E.; Letunic, I.; Lonsdale, D.; Lopez, R.; Madera, M.; Maslen, J.; McAnulla, C.; McDowall, J. (2011). "InterPro in 2011: New developments in the family and domain prediction database". Nucleic Acids Research 40 (Database issue): D306–D312. PMC 3245097. PMID 22096229. doi:10.1093/nar/gkr948. 
  2. Apweiler, R.; Attwood, T. K.; Bairoch, A.; Bateman, A.; Birney, E.; Biswas, M.; Bucher, P.; Cerutti, L.; Corpet, F.; Croning, M. D.; Durbin, R.; Falquet, L.; Fleischmann, W.; Gouzy, J.; Hermjakob, H.; Hulo, N.; Jonassen, I.; Kahn, D.; Kanapin, A.; Karavidopoulou, Y.; Lopez, R.; Marx, B.; Mulder, N. J.; Oinn, T. M.; Pagni, M.; Servant, F.; Sigrist, C. J.; Zdobnov, E. M. (2001). "The InterPro database, an integrated documentation resource for protein families, domains and functional sites". Nucleic Acids Research 29 (1): 37–40. PMC 29841. PMID 11125043. doi:10.1093/nar/29.1.37. 
  3. Apweiler, R.; Attwood, T. K.; Bairoch, A.; Bateman, A.; Birney, E.; Biswas, M.; Bucher, P.; Cerutti, L.; Corpet, F.; Croning, M. D. R.; Durbin, R.; Falquet, L.; Fleischmann, W.; Gouzy, J.; Hermjakob, H.; Hulo, N.; Jonassen, I.; Kahn, D.; Kanapin, A.; Karavidopoulou, Y.; Lopez, R.; Marx, B.; Mulder, N. J.; Oinn, T. M.; Pagni, M.; Servant, F.; Sigrist, C. J. A.; Zdobnov, E. M.; Interpro, C. (2000). "InterPro--an integrated documentation resource for protein families, domains and functional sites". Bioinformatics 16 (12): 1145–1150. PMID 11159333. doi:10.1093/bioinformatics/16.12.1145. 

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by razib.in