HomoloGene, uma ferramenta do Centro Nacional de Informações sobre Biotecnologia dos Estados Unidos (NCBI), é um sistema para detecção automatizada de homólogos (similaridade atribuível à descendência de um ancestral comum) entre os genes anotados de vários genomas eucarióticos completamente sequenciados.[1]
O processamento do HomoloGene consiste na análise de proteínas dos organismos de entrada. As sequências são comparadas usando o blastp (programas que pesquisam bancos de dados de proteínas usando uma consulta de proteína.),[2] então combinadas e colocadas em grupos, usando uma árvore taxonômica construída a partir da similaridade da seqüência, onde organismos mais próximos são combinados primeiro, e então outros organismos são adicionados à árvore. Os alinhamentos de proteínas são mapeados de volta para suas seqüências de DNA correspondentes e, em seguida, métricas de distância como distâncias moleculares de Jukes e Cantor (1969), a relação Ka/Ks pode ser calculada.[3][4][5]