poniedziałek, 4 czerwca 2012


Reprezentacja informacji w komputerze.

W jaki sposób informacja przechowywana jest w komputerze?

„Liczenie” i „myślenie”.

Komputer liczy a człowiek myśli? To nieporozumienie!
Poziom: molekularny - te same atomy, różne cząsteczki, ale jakościowo podobnie.
Podstawowe elementy: bramki logiczne, komórki pamięci <-> neurony, synapsy.
  Neurony zliczają impulsy, obwody scalone zliczają impulsy.
Poziom symboliczny: mózgi i komputery przetwarzają informację.
Analogia mózg-umysł i komputery-programy: użyteczna, chociaż niedoskonała.

Informacja - pojęcie abstrakcyjne

Informacja: maksymalna szybkość samochódu wynosi 160 km/h.
Ta sama informacja: 100 mil/h, 44.4 m/sek, zapisana alfabetem arabskim, pismem Brailla itd.

Dane: konkretna reprezentacja informacji

Wybór reprezentacji informacji jest bardzo ważny dla wygody przetwarzania danych - spróbujcie np. podzielić dwie liczby zapisane rzymskimi cyframi. 

Typy danych

Dane typu logicznego: „tak” lub „nie”
Dane alfanumeryczne (alfabet+liczby)
Dane numeryczne
Dane graficzne
Dane alfanumeryczne o ustalonej strukturze (rekordy),
Dane muzyczne

3.1 Bity i bajty

Bit” = binary unit, czyli jednostka dwójkowa, tak/nie.
Ciąg bitów wystarczy by przekazać dowolną wiadomość: np. za pomocą tam-tamów czy telegrafu.
Alfabet polski ma 35 liter, uwzględniając małe i duże litery + znaki specjalne mamy prawie 100 znaków.
Bramki tranzystorów przyjmują tylko dwa stany: przewodzą lub nie, są binarne.
1 bit: 0, 1, rozróżnia 2 znaki.
2 bity: 00, 01, 10, 11, rozróżniają 4 znaki.
3 bity: 000, 001, 010, 011, 100, 101, 110, 111, rozróżniają 8 znaków.
4 bity: 0000 ... 1111, rozróżniają 16 znaków.
8 bitów pozwala odróżnić 28 = 16 x 16 = 256 znaków.
Ciąg 8 bitów = 1 bajt, wygodna jednostka do pamiętania podstawowych symboli. 

Standardy reprezentowania znaków alfanumerycznych:

ASCII -  American Standard Code for Information Exchange, używa 7 bitów.
ANSI - American National Standards Institute.
Starsze standardy, np. EBCDIC (Extended Binary-Coded-Decimal Interchange Code), na nielicznych już komputerach centralnych.
Każdy znak można zapisać w postaci dwójkowej. Na przykład imię JOHN można zapisać w kodzie ASCI tak jak na rysunku. Grafika, dźwięk i wideo da się rownież zapisać w kodzie binarnym.



znak
kod binarny
znak
kod binarny

A

0100 0001

N

0100 1110

B

0100 0010

O

0100 1111

C

0100 0011

P

0101 0000

D

0100 0100

Q

0101 0001

E

0100 0101

R

0101 0010

F

0100 0110

S

0101 0011

G

0100 0111

T

0101 0100

H

0100 1000

U

0101 0101

I

0100 1001

V

0101 0110

J

0100 1010

W

0101 0111

K

0100 1011

X

0101 1000

L

0100 1100

Y

0101 1001

M

0100 1101

Z

0101 1010
Rozszerzony standard ASCII: 8 bitów.
Różne rozszerzenia:
DOS: Code Page, czyli strona  kodowa 852, zwana Latin 2
Windows 3/95: CP-1250, Central-European encoding
Oficjalny standard: ISO-8859-2, nieco odmienne, stosowany przez zwolenników walki z Microsoftem i komplikowania sobie życia.
Od 1992 roku standard Unicode, 2 bajty/znak.
W jednym pliku można zapisać 2562=65536 znaków, w tym około 3000 znaków definiowalnych przez użytkownika.
Unicode jest używany w systemach operacyjnych Windows NT, Novell Netware, Windows 98 i nowszych wersjach 95, pakietach Office'97. Widać to po wielkości plików.

Brak komentarzy:

Prześlij komentarz