.dsy:it. ~ AlphaGamma's journal ~ Riassunto della tesi... |
|
|
» |
Il problema consiste nello sviluppare algoritmi che prendano in input due immagini (rappresentanti due diverse scene del medesimo soggetto) ed elabori a partire da queste una terza immagine che rappresenti una visione “panoramica” del soggetto stesso. Per soggetto si può intendere sia un paesaggio acquisito con una fotocamera, sia un oggetto tridimensionale realizzato tramite programmi di elaborazione 3D, di cui vengono presentate due scene. La soluzione proposta deve essere una soluzione generale, e quindi non deve presupporre nessun vincolo sulle immagini di input, se non una parziale sovrapposizione.
La soluzione proposta si basa sull'algoritmo “Direct Linear Trasformation” (DLT). Questo algoritmo parte dalla considerazione che ad ogni immagine sia associato un piano proiettivo omogeneo. Tramite una trasformazione lineare proiettiva (ovvero una omografia 2D), è possibile trasformare ogni punto di un piano proiettivo in un punto di un altro piano proiettivo. Portando tutti i punti di una immagine sul piano proiettivo dell'altra, partendo da alcuni punti di corrispondenza, è possibile ottenere una immagine panoramica che contiene entrambe le immagini. Matematicamente, l'omografia è rappresentata da una matrice quadrata di ordine 3 (con 8 gradi di libertà). L'obiettivo di questo algoritmo è trovare questa matrice.
L'algoritmo può essere così sintetizzato:
a) vengono inserite in input un numero 4 di coppie di coordinate di punti (equivalenti agli 8 gradi di libertà) corrispondenti tra le due immagini (appartenenti all'area parzialmente sovrapposta delle due immagini)
b) queste coordinate vengono inserite come coefficenti in una sistema lineare omogeneo le cui incognite sono gli elementi della matrice dell'omografia.
c) il sistema viene risolto attraverso l'algoritmo della single value decomposition (SVD).
d) il risultato viene restituito per compiere la vera e propria trasformazione.
Come considerazione successiva, va notato che le immagini digitali non sono composte da infiniti punti, ma da un numero finito di pixel, che corrispondono ad aree quadrate (costituite ciascuna da infiniti punti) con la medesima informazione di colore. Ciò porta fin dall'inserimento delle coordinate di input, ad una approssimazione della matrice di trasformazione e quindi ad una omografia parzialmente non corretta. Questa può essere ottimizzata inserendo in input un numero maggiore di coppie di coordinate di corrispondenza, e stimando la trasformazione ottimale.
Inoltre, nella trasformazione un pixel di un'immagine viene messo in corrispondenza con un'area a forma di quadrilatero di forma generica nella seconda immagine, che occuperà un certo numero di pixel, alcuni completamente ed alcuni parzialmente. Di questo quadrangolo può essere dunque calcolata l'informazione di colore attraverso una media pesata rispetto all'area occupata di ogni pixel, e tale informazione riportata sul pixel proiettato, ottenendo in maniera efficiente una informazione di colore pesata.
Il programma è stato realizzato utilizzando Microsoft Visual C++ 6, con l'estensione delle librerie QT (versione 2.3 non commerciale) e testato su un Pc Compaq Evo n800v, con cpu P-4m 1800, 512 MB Ram e Windows Xp Professional. |
|
mood:
musone :D | now playing: Offsprings - Self Esteem |
Commento di Berserk (non registrato) |
13-01-2004 20:55 |
|
» |
guarda che minimo vogliono due o 3 pagine..... |
|
Commento di AlphaGamma |
13-01-2004 20:55 |
|
» |
Al prof andava bene. ;) |
|
Commento di LazerPhEa |
13-01-2004 20:55 |
|
» |
:D Ma ti sono servite a qualcosa le mie immagini? |
|
Commento di AlphaGamma |
13-01-2004 20:55 |
|
» |
Devo ancora usarle... ;) |
|
Commento di Berserk |
13-01-2004 20:55 |
|
» |
scherzavo :asd: :D |
|
Commento di AlphaGamma |
13-01-2004 20:55 |
|
» |
Anche io. :) |
|
Commento di 10t8or |
13-01-2004 20:55 |
|
» |
stai scherzando (Berserk)?? io ho sempre sentito in giro come CALDO consiglio quello di NON superare le DUE pagine!!
se proprio vuoi che non te le leggano magari allora si meglio farne di piu'.. ;)
cmq il riassunot mi piace.. forse stona iniziare con il problema consiste nel ecc.. no? solo imho.. vero che uppi il programma su sourceforge?? ;) ;) |
|
Commento di AlphaGamma |
13-01-2004 20:55 |
|
» |
il programa sarà open source... :) per sourceforge ci penserò... ;) |
|
Commento di Berserk (non registrato) |
13-01-2004 20:55 |
|
» |
» stai scherzando (Berserk)?? io ho sempre sentito in giro come CALDO consiglio quello di NON superare le DUE pagine!!
se proprio vuoi che non te le leggano magari allora si meglio farne di piu'..
:asd: ....dalla mia esperienza cmq secondo me nn leggono neanche quello.... si fidano del giudizio del relatore :D |
|
|
|
|