Modello della borsa di parole

Il modello della borsa di parole (in inglese: Bag-of-words model, in sigla: BoW) è un metodo utilizzato nell'Information Retrieval e nel Elaborazione del linguaggio naturale per rappresentare documenti ignorando l'ordine delle parole. In questo modello, ogni documento è considerato in quanto contiene parole, analogamente a una borsa; ciò consente una gestione di queste basata su liste, dove ogni borsa contiene determinate parole di una lista. Nella Computer Vision si applica alla classificazione delle immagini, trattando l'immagine come caratteristiche (feature) di parole. In particolare, nell'object recognition, un'immagine può essere trattata come un documento e le caratteristiche rilevate in determinati punti dell'immagine si considerano "parole" visuali. Nella classificazione di documenti, la borsa di parole è un vettore sparso del numero di occorrenze delle parole, che non è altro che un istogramma sparso sul vocabolario. In Computer Vision una borsa di parole visuale è un vettore sparso di occorrenze del vocabolario di caratteristiche locali dell'immagine.


From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Tubidy