InterPro je baza podataka proteinskih familija, domena i funkcionalnih mesta na kojima su nađene prepoznatljive osobine poznatih proteina koje se mogu primeniti na nove proteinske sekvence[1] da bi se funkcionalno karakterisale.
InterPro sadržaj je baziran na diagnostičkim potpisima i proteinima koji im u značajnoj meri odgovaraju. Potpisi se sastoje of modela (jednostavnih vrsta, poput regularnih izraza, ili kompleksnijih, kao što su Skriveni Markovljevi modeli) koji opisuju proteinske familije, domene ili mesta. Modeli su izvedeni iz aminokiselinskih sekvenci poznatih familija ili domena. Oni su naknadno korišćeni za pretragu nepoznatih sekvenci (kao što su one dobijene sekvenciranjem genoma) sa ciljem njihove klasifikacije. Svaki član kolekcije InterPro baza podataka doprinosi različitoj niši, od veoma visokog nivoa, strukturno-bazirane klasifikacije (SUPERFAMILY i CATH-Gene3D) do veoma specifičnih klasifikacija potfamilija (PRINTS i PANTHER).