Δευτέρα, 1 Οκτωβρίου 2007

Β - ΚΕΦ1: ΨΗΦΙΑΚΟΣ ΚΟΣΜΟΣ

ASCII: ταυτίζεται η έννοια του byte με την έννοια του χαρακτήρα.
Πρέπει να επισημάνουμε στα παιδιά ότι αυτό γινότανε στα πρώτα κομπιούτερ
και ότι σήμερα χρησιμοποιείται ο κώδικας UNICODE που χρησιμοποιεί 2 byte
για κάθε χαρακτήρα και επομένως μπορεί να αντιστοιχίσει περίπου 65000
χαρακτήρες. Φυσικά δεν χρειάζεται να πούμε άλλες λεπτομέρειες για τον
unicode.

--
Κασσελούρης, Νίκος
http://users.otenet.gr/~nikkas/

1 σχόλιο:

Simon είπε...

Το πρότυπο Unicode περιγράφει όλους τους διαθέσιμους χαρακτήρες κάθε γλώσσας. Μέχρι στιγμής έχουν καταγραφεί περισσότεροι από 100.000 χαρακτήρες. Το μέγιστο εύρος που έχει το Unicode είναι 0x10000 χαρακτήρες (>1.000.000).

Υπάρχουν διάφορες κωδικοποιήσεις για την χρήση του προτύπου Unicode από τους υπολογιστές. Μια από τις πιο γνωστές είναι το UTF-8, που είναι κωδικοποίηση μεταβλητού μήκους (bytes, από 1 ως 6). Για χαρακτήρες 0-127, ταυτίζεται με το ASCII οπότε ένα κείμενο με αγγλικά μόνο είναι αυτόματα συμβατό στην κωδικοποίηση UTF-8. Τα ελληνικά βρίσκονται στην περιοχή των δύο byte ενώ το πολυτονικό στα 3 byte.

Περισσότερες πληροφορίες στη Wikipedia.