Εργαλεία Χρήστη

Εργαλεία ιστότοπου


c_image_processing

Σύγκριση εκδόσεων

Εδώ βλέπετε τις διαφορές μεταξύ της επιλεγμένης έκδοσης και της τρέχουσας έκδοσης της σελίδας.

Σύνδεσμος σε αυτή την προβολή διαφορών.

Προηγούμενος έλεγχος και από τις δύο πλευρές Προηγούμενη αναθεώρηση
Επόμενη αναθεώρηση
Προηγούμενη αναθεώρηση
c_image_processing [2014/12/27 00:17]
chiossif
c_image_processing [2020/11/21 09:52] (τρέχουσα)
Γραμμή 2: Γραμμή 2:
  
 Στο wiki αυτό θα μάθουμε να διαχειριζόμαστε και γενικότερα επεξεργαζόμαστε πολυκάναλες εικόνες με την [[https://en.wikipedia.org/wiki/C_%28programming_language%29|γλώσσα προγραμματισμού C]]. Θα ξεκινήσουμε από απλές λειτουργίες όπως ανάγνωση εικόνας και αριθμητική δεικτών και θα προχωρήσουμε σε πιο σύνθετα θέματα :-) Στο wiki αυτό θα μάθουμε να διαχειριζόμαστε και γενικότερα επεξεργαζόμαστε πολυκάναλες εικόνες με την [[https://en.wikipedia.org/wiki/C_%28programming_language%29|γλώσσα προγραμματισμού C]]. Θα ξεκινήσουμε από απλές λειτουργίες όπως ανάγνωση εικόνας και αριθμητική δεικτών και θα προχωρήσουμε σε πιο σύνθετα θέματα :-)
 +
  
  
Γραμμή 9: Γραμμή 10:
 Έτσι, προκειμένου η διαδικασία να γίνει πιο εύκολη, αρκεί να δημιουργηθεί ένα αρχείο που περιέχει μόνο τις τιμές των εικονοστοιχείων και όχι άλλες πληροφορίες που αφορούν το μέγεθος της εικόνας, τον τύπο της κ.τ.λ. Ένα τέτοιο πρότυπο είναι το πρότυπο [[http://users.ntua.gr/chiossif/Free_As_Freedom_Software/BIL_BIP_BSQ.pdf|BIL/BIP/BSQ]] (το οποίο έχουμε μάθει ως .ers) το οποίο μετατρέπει την εικόνα σε δύο αρχεία. Το πρώτο που έχει κατάληξη .ers περιέχει όλες τις πληροφορίες της εικόνας (γραμμές, στήλες, κανάλια, τύπος δεδομένων) και το δεύτερο την εικόνα με τις τιμές της σε όλα τα κανάλια. Έτσι αρκεί, να μετατρέψουμε σε πρώτη φάση την εικόνα μας σε .ers. Η μετατροπή μπορεί να γίνει με πολλούς τρόπους, αλλά ένας από τους πιο εύκολους είναι μέσω της βιβλιοθήκης gdal. Η [[http://www.gdal.org/|gdal]] είναι μια βιβλιοθήκη ελεύθερου λογισμικού που χρησιμοποιείται για γεωχωρικά δεδομένα και υποστηρίζει όλα τα πρότυπα στα οποία μπορεί να έχει αποθηκευτεί μια εικόνα. Έτσι, προκειμένου η διαδικασία να γίνει πιο εύκολη, αρκεί να δημιουργηθεί ένα αρχείο που περιέχει μόνο τις τιμές των εικονοστοιχείων και όχι άλλες πληροφορίες που αφορούν το μέγεθος της εικόνας, τον τύπο της κ.τ.λ. Ένα τέτοιο πρότυπο είναι το πρότυπο [[http://users.ntua.gr/chiossif/Free_As_Freedom_Software/BIL_BIP_BSQ.pdf|BIL/BIP/BSQ]] (το οποίο έχουμε μάθει ως .ers) το οποίο μετατρέπει την εικόνα σε δύο αρχεία. Το πρώτο που έχει κατάληξη .ers περιέχει όλες τις πληροφορίες της εικόνας (γραμμές, στήλες, κανάλια, τύπος δεδομένων) και το δεύτερο την εικόνα με τις τιμές της σε όλα τα κανάλια. Έτσι αρκεί, να μετατρέψουμε σε πρώτη φάση την εικόνα μας σε .ers. Η μετατροπή μπορεί να γίνει με πολλούς τρόπους, αλλά ένας από τους πιο εύκολους είναι μέσω της βιβλιοθήκης gdal. Η [[http://www.gdal.org/|gdal]] είναι μια βιβλιοθήκη ελεύθερου λογισμικού που χρησιμοποιείται για γεωχωρικά δεδομένα και υποστηρίζει όλα τα πρότυπα στα οποία μπορεί να έχει αποθηκευτεί μια εικόνα.
  
-Έχοντας λοιπόν την [[ https://upload.wikimedia.org/wikipedia/en/2/24/Lenna.png|εικόνα]] μας την μεταφορτώνουμε με την εντολή:+Έχοντας λοιπόν την [[https://upload.wikimedia.org/wikipedia/en/7/7d/Lenna_%28test_image%29.png |εικόνα]] μας την μεταφορτώνουμε με την εντολή:
  wget https://upload.wikimedia.org/wikipedia/en/2/24/Lenna.png  wget https://upload.wikimedia.org/wikipedia/en/2/24/Lenna.png
 και μέσω της gdal την μετατρέπουμε σε ers πρότυπο και μέσω της gdal την μετατρέπουμε σε ers πρότυπο
Γραμμή 194: Γραμμή 195:
 -> Ο συνδυασμός των παραπάνω τεχνικών δήλωσης και κατάληψης μνήμης επιτρέπει την άμεση διευθυνσιοδότηση χωρίς αριθμητική δεικτών. -> Ο συνδυασμός των παραπάνω τεχνικών δήλωσης και κατάληψης μνήμης επιτρέπει την άμεση διευθυνσιοδότηση χωρίς αριθμητική δεικτών.
    
 +
 +
  
  
Γραμμή 224: Γραμμή 227:
 και την χρησιμοποιώ έτσι:  και την χρησιμοποιώ έτσι: 
     IMAGE_PIXEL(i,j,k)     IMAGE_PIXEL(i,j,k)
 +
 +Παράδειγμα [[http://stackoverflow.com/questions/1616802/when-to-use-function-like-macros-in-c|μακροεντολής]]:
 +    #define IMAGE_PIXEL(x,y,z) (image [(((x)*bands)+(y))*cols+(z)])
 +
 +και παράδειγμα συνάρτησης:
 +    char image_pixel(int x, int y, int z){
 +     return (image [(((x)*bands)+(y))*cols+(z)]);
 +    }
  
 Προσοχή θέλουν εδώ τα ονόματα των εμπλεκομένων μεταβλητών καθώς και η [[http://www.tutorialspoint.com/cprogramming/c_scope_rules.htm|ορατότητά]] τους. Την 2η έκδοση την χρησιμοποιώ όταν φτιάχνω ένα λογισμικό με πολλές αναφορές στην εικόνα και θέλω να είναι ευανάγνωστο. Δυστυχώς εδώ θέλει πολύ προσοχή η σωστή δήλωση των μεταβλητών και η κατάληψη της μνήμης. Τέλος, και για να δώσω την σωστή/αληθινή απάντηση, καμιά από τις δύο. Διότι σε αυτές η εικόνα πρέπει να έρθει όλη στην μνήμη και άρα η μνήμη του υπολογιστή είναι ένα όριο για το μέγεθος της εικόνας. Ακολουθεί καλύτερο παράδειγμα με άλγεβρα εικόνων χωρίς αυτό τον περιορισμό ;-) Προσοχή θέλουν εδώ τα ονόματα των εμπλεκομένων μεταβλητών καθώς και η [[http://www.tutorialspoint.com/cprogramming/c_scope_rules.htm|ορατότητά]] τους. Την 2η έκδοση την χρησιμοποιώ όταν φτιάχνω ένα λογισμικό με πολλές αναφορές στην εικόνα και θέλω να είναι ευανάγνωστο. Δυστυχώς εδώ θέλει πολύ προσοχή η σωστή δήλωση των μεταβλητών και η κατάληψη της μνήμης. Τέλος, και για να δώσω την σωστή/αληθινή απάντηση, καμιά από τις δύο. Διότι σε αυτές η εικόνα πρέπει να έρθει όλη στην μνήμη και άρα η μνήμη του υπολογιστή είναι ένα όριο για το μέγεθος της εικόνας. Ακολουθεί καλύτερο παράδειγμα με άλγεβρα εικόνων χωρίς αυτό τον περιορισμό ;-)
Γραμμή 378: Γραμμή 389:
  
 -> Προσέξτε πως ελέγχουμε την απόδοση τιμής στο αποτέλεσμα. Μην ξεχνάμε πως προδιαγραφή (και άρα περιορισμός) είναι η εικόνα αποτέλεσμα να είναι 8bit όπως και η εικόνα εισόδου. Αυτό το λογισμικό αντιμετωπίζει μόνο εικόνες 8bit και έτσι πρέπει να έχει τιμές στο εύρος [0,255] (unsigned char). -> Προσέξτε πως ελέγχουμε την απόδοση τιμής στο αποτέλεσμα. Μην ξεχνάμε πως προδιαγραφή (και άρα περιορισμός) είναι η εικόνα αποτέλεσμα να είναι 8bit όπως και η εικόνα εισόδου. Αυτό το λογισμικό αντιμετωπίζει μόνο εικόνες 8bit και έτσι πρέπει να έχει τιμές στο εύρος [0,255] (unsigned char).
 +
 +
 +
 +
 +
 +
  
 ====Ερωτήσεις==== ====Ερωτήσεις====
  
-Αναμένω τις ερωτήσεις σας :-)+* Ερ.: Έχουμε δύο εικόνες με ένα κανάλι και ίδιες διαστάσεις από το ίδιο αντικείμενο/περιοχή και θέλουμε να δούμε οπτικά την ταύτισή τους με την μορφή σκακιέρας: στα άσπρα τετράγωνα η μία στα μαύρα η άλλη. Δεδομένα μας είναι τα ονόματα των αρχείων των εικόνων σε ERS φορμάτ άρα και οι γραμμές και οι στήλες τους, το όνομα της εικόνας σκακιέρας και φυσικά το μέγεθος του τετραγώνου της σκακιέρας. Υποδ. Ξεκινήστε αυτό το πρόγραμμα με χρήση του παραπάνω κώδικα. Στην απάντηση τεκμηριώστε τις κύριες αλλαγές ενώ μέσα στον κώδικα προσθέστε σχόλια :-) 
 + 
 +* Απ.: Χρησιμοποιώντας τον παραπάνω κώδικα έγιναν δύο βασικές αλλαγές. Η πρώτη αφορά στα δεδομένα τα οποία χρειάζονται και πρέπει να διαβαστούν και η δεύτερη στη συνθήκη η οποία θα υλοποιήσει το επιθυμητό αποτέλεσμα. Συγκεκριμένα, σε αυτήν την περίπτωση έχουμε εικόνες με ένα κανάλι και όχι rgb,  οπότε απλοποιείται η διαδικασία του διαβάσματος. Επίσης, έπρεπε να προστεθεί μια μεταβλητή για το μέγεθος του τετραγώνου της σκακιέρας η ssize.   
 + 
 +Το πρόγραμμα διαβάζει τις εικόνες σε τυποποίηση ERS. Για τη μετατροπή αυτή έχει χρησιμοποιηθεί η ακόλουθη εντολή από τερματικό : 
 +    gdal_translate -of ers -ot byte -strict -scale -b 1 input.tif input.ers 
 + 
 +σε σύστημα με εγκατεστημένη την βιβλιοθήκη gdal. 
 + 
 +Την υλοποίηση θα την βρείτε στον σύνδεσμο [[https://dl.dropboxusercontent.com/u/1145459/skakiera.c|αυτό]] και είναι ανάλογη με το παράδειγμα παραπάνω. Η κύρια λειτουργία εκτελείται στην γραμμή: 
 + 
 +    image_out[k]=((i/ssize-k/ssize)%2)?image_in1[k]:image_in2[k];
  
 +όπου με τον τελεστή ()?: αποφασίζεται και αποθηκεύεται στην εικόνα αποτέλεσμα image_out στην θέση k (πρόκειται για ενδιάμεση μνήμη αποθήκευσης μιας γραμμής) είτε η image_in1 είτε η image_in2. Η απόφαση λαμβάνεται από το λογικό (i/ssize-k/ssize)%2 όπου i η τρέχουσα γραμμή η οποία περιέχεται στις ενδιάμεσες μνήμες των εικόνων, k η τρέχουσα στήλη (ως στοιχείο των ενδιάμεσων μνημών) και ssize το μέγεθος του τετράγωνου της σκακιέρας όπως προαναφέρθηκε. :-)
  
 ====Ασκήσεις==== ====Ασκήσεις====
Γραμμή 600: Γραμμή 629:
  
  
-=====Φιλτράρισμα σε εικόνα με παράλληλο προγραμματισμό=====+ 
 +=====Παράλληλος προγραμματισμός στην επεξεργασία εικόνας=====
  
 Μαθαίνουμε επεξεργασία εικόνας σε C και είδαμε μέχρι εδώ πως να δουλεύουμε με τεράστιες εικόνες διαβάζοντας μόνο ότι είναι απαραίτητο σε κάθε ανακύκλωση. Αν όμως η εικόνα χωράει στην μνήμη; Πως μπορούμε να κάνουμε επεξεργασίες με την μεγαλύτερη δυνατή ταχύτητα; Την απάντηση εδώ μας την δίνει ο παράλληλος προγραμματισμός. :-) Μαθαίνουμε επεξεργασία εικόνας σε C και είδαμε μέχρι εδώ πως να δουλεύουμε με τεράστιες εικόνες διαβάζοντας μόνο ότι είναι απαραίτητο σε κάθε ανακύκλωση. Αν όμως η εικόνα χωράει στην μνήμη; Πως μπορούμε να κάνουμε επεξεργασίες με την μεγαλύτερη δυνατή ταχύτητα; Την απάντηση εδώ μας την δίνει ο παράλληλος προγραμματισμός. :-)
-Οι σύγχρονοι επεξεργαστές περιέχουν πολλούς πυρήνες και έτσι έχουν την δυνατότητα να εκτελέσουν πολλές διεργασίες ταυτόχρονα αρκεί η μία να μην εξαρτάται από την άλλη. Στην περίπτωση των εικόνων αυτό είναι εφικτό με την τμηματική εκτέλεση μιας εικόνας. Αν για παράδειγμα έχουμε τετραπύρηνο επεξεργαστή μπορούμε να κόψουμε μια εικόνα στα τέσσερα (σταυρό) και να δώσουμε κάθε κομάτι σε κάθε πυρήνα. Φυσικά ο προγραμματισμός σε αυτή την περίπτωση θα ήταν περίπλοκος.+ 
 +Οι σύγχρονοι επεξεργαστές περιέχουν πολλούς πυρήνες και έτσι έχουν την δυνατότητα να εκτελέσουν πολλές διεργασίες ταυτόχρονα αρκεί η μία να μην εξαρτάται από την άλλη. Στην περίπτωση των εικόνων αυτό είναι εφικτό με την τμηματική εκτέλεση μιας εικόνας. Αν για παράδειγμα έχουμε τετραπύρηνο επεξεργαστή μπορούμε να κόψουμε μια εικόνα στα τέσσερα (σταυρό) και να δώσουμε κάθε κομμάτι σε κάθε πυρήνα. Φυσικά ο προγραμματισμός σε αυτή την περίπτωση θα ήταν περίπλοκος. 
 Σήμερα χάρη στην [[http://openmp.org/wp/about-openmp/|OpenMP]] μπορούμε με ελάχιστες αλλαγές να προγραμματίσουμε παράλληλα. Δείτε το ακόλουθο πρόγραμμα το οποίο εφαρμόζει το φίλτρο [[https://en.wikipedia.org/wiki/Kirsch_operator|Kirsch]] σε μία μονοχρωμματική εικόνα:  Σήμερα χάρη στην [[http://openmp.org/wp/about-openmp/|OpenMP]] μπορούμε με ελάχιστες αλλαγές να προγραμματίσουμε παράλληλα. Δείτε το ακόλουθο πρόγραμμα το οποίο εφαρμόζει το φίλτρο [[https://en.wikipedia.org/wiki/Kirsch_operator|Kirsch]] σε μία μονοχρωμματική εικόνα: 
  
Γραμμή 726: Γραμμή 758:
 Δοκιμάστε το στην Lenna_Grey.ers με την εντολή: Δοκιμάστε το στην Lenna_Grey.ers με την εντολή:
   ./a.out Lenna_Grey 512 512 Lenna_Kirsch   ./a.out Lenna_Grey 512 512 Lenna_Kirsch
-Στιγμιαίο έτσι; Όπως θα ήταν και χωρίς τις παραπάνω παράλληλες ρυθμίσεις. Ναι αλλά η Lenna_Grey είναι μικρή. Για δοκιμάστε με μία εικόνα 5120χ5120 ή μεγαλύτερη και τα συζητάμε ;-) +Στιγμιαίο έτσι; Όπως θα ήταν και χωρίς τις παραπάνω παράλληλες ρυθμίσεις. Ναι αλλά η Lenna_Grey είναι μικρή. Για δοκιμάστε με μία εικόνα 5120x5120 ή μεγαλύτερη και τα συζητάμε ;-)
-Περισσότερα για παράλληλο προγραμματισμό θα βρείτε στον ιστοχώρο της [[https://computing.llnl.gov/tutorials/openMP/|OpenMP]] και γενικότερα [[https://computing.llnl.gov/tutorials/parallel_comp/|εδώ]]. Πάντως εδώ δεν θα συνεχίσουμε άλλο... Ελπίζω η σπίθα να άναψε ;-)+
  
-Καλή παραλληλοποίηση ;-)+Περισσότερα για παράλληλο προγραμματισμό θα βρείτε στον ιστοχώρο της [[https://computing.llnl.gov/tutorials/openMP/|OpenMP]] και γενικότερα [[https://computing.llnl.gov/tutorials/parallel_comp/|εδώ]]. Πάντως εδώ δεν θα συνεχίσουμε άλλο...
  
 +Ελπίζω η σπίθα να άναψε ;-)
 +
 +Καλή παραλληλοποίηση ;-)
  
 =====Επίλογος===== =====Επίλογος=====
c_image_processing.1419639459.txt.gz · Τελευταία τροποποίηση: 2020/11/21 09:52 (εξωτερική τροποποίηση)