Technika cyfrowa - Warsztat: Kurs C: typy danych

Przy programowaniu urządzeń mikrokontrolerowych najczęściej będziesz pracował z bitami. Wynika z tego, że musisz bardzo dobrze rozumieć bity oraz metody ich przetwarzania.

Pierwszą rzeczą do zrozumienia jest pojęcie informacji. Czym jest informacja? Okazuje się, że dokładna odpowiedź na to pytanie jest dosyć trudna. Oczywiście powstają różne definicje na potrzeby różnych nauk. Nam jednak chodzi o rozumienie intuicyjne. Cechą charakterystyczną informacji jest to, że nie można podać jakiejś jednej, ściśle określonej postaci informacji. Dlatego, iż informacja jest interpretowana w naszych mózgach jako coś, co zmniejsza naszą niepewność w określonej sytuacji. Dla jednych coś może być informacją, dla innych to samo może nic nie znaczyć. Przykładem mogą być czasy wojenne. W konspiracji używano różnych znaków do porozumiewania się w grupie wtajemniczonych, które dla osób z poza tej grupy nie przekazywały żadnego znaczenia. Np. mężczyzna stojący na rogu ulicy zdejmuje z głowy czapkę, jakby się komuś kłaniał. Jest to sygnał dla pozostałych, że nadjeżdża niemiecka ciężarówka, którą zaraz należy zaatakować. Osoba postronna tej informacji nie odbierze.

Aby doszło do przekazania informacji muszą być spełnione pewne warunki.

W procesie przekazania informacji mamy nadawcę N oraz odbiorcę O. Nie muszą to być wcale ludzie. W elektronice obu często zastępują komputery.

Nadawca i odbiorca muszą znajdować się we wspólnym ośrodku, który umożliwia przesyłanie informacji. W przykładzie z II Wojny Światowej członek ruchu oporu sygnalizujący grupie uderzeniowej przyjazd ciężarówki musi być przez tę grupę widziany, inaczej cały system na nic. Jeśli ktoś chce przekazać coś głosem, to musi być słyszany.

Nadawca wysyła informację, odbiorca ją odbiera.

Jeśli sądzisz, że to wszystko, to niestety jesteś w błędzie. Diabeł jak zwykle tkwi w szczegółach. Teraz należy uzgodnić w jaki sposób ta informacja ma być wysyłana, czyli jaką ma przybrać postać: mowa, pismo, gesty, sygnały radiowe, światło lasera, prąd elektryczny, itd. Innymi słowy musimy zdefiniować sobie fizyczny zbiór sygnałów, które będą używane do przesyłania wiadomości. Dodatkowo odbiorca musi wiedzieć, jak zinterpretować otrzymany sygnał. Czyli sygnałom należy przypisać odpowiednie znaczenia.

Wynika z tego następująca procedura postępowania:

Określ wiadomości, które chcesz przesyłać.
Dobierz odpowiednie sygnały, tak aby nadawca mógł je wysyłać, a odbiorca odbierać. Sygnałów musi być tyle, ile określiłeś wiadomości.
Przypisz każdej wiadomości inny sygnał, a następnie ustal to przypisanie z odbiorcą.

Jakie sygnały wybrać? Nie jest to wcale takie oczywiste. Pierwsze maszyny cyfrowe operowały na cyfrach dziesiętnych. Jednak komplikowało to ich konstrukcję. W roku 1936 niemiecki konstruktor Konrad Zuse zbudował pierwszy na świecie komputer oparty na nowych sygnałach - na bitach. Sama nazwa bit powstała dużo później. Bit jest najprostszym z możliwych sygnałów. Występuje tylko w dwóch różniących się od siebie postaciach. O tym, jaką postać przyjmują bity, decyduje ośrodek oraz realizacja techniczna. Przykłady realizacji bitów są następujące:

BIT (ang. binary digit – cyfra dwójkowa)
Postać pierwsza	Postać druga
Jest prąd w przewodzie	Brak prądu w przewodzie
Napięcie 2,4...5V	Napięcie 0,2...0,8V
Fala radiowa 5MHz	Fala radiowa 7MHz
Jest światło lasera	Brak światła lasera
Litera H (ang. High)	Litera L (ang. Low)
Cyfra 1	Cyfra 0

Wewnątrz komputera bity najczęściej są reprezentowane poziomami napięć, które przetwarzają cyfrowe układy elektroniczne. Do zapisu bitów w elektronice stosuje się litery H/L, gdzie H oznacza stan wysoki (np. 5V), a L oznacza stan niski (np. 0,4V). W informatyce bity oznaczamy cyframi 1 i 0. 1 odpowiada poziomowi H, a 0 odpowiada poziomowi L.

Powstaje teraz problem: jak kodować informację za pomocą bitów? Pokażemy to na przykładach.

Jeden bit może przyjmować tylko jedną z dwóch wartości. Jeśli tą wartość potraktujemy jako wiadomość, to za pomocą jednego bitu będziesz mógł kodować dwie różne wiadomości:

Bit 1: wiadomość pierwsza
Bit 0: wiadomość druga

Jakie to mogą być wiadomości? Takie, jakie będziesz potrzebował. Na przykład:

Bit 1: przycisk nie jest naciśniety
Bit 0: przycisk jest naciśnięty

Albo:

Bit 1: silnik pracuje
Bit 0: silnik nie pracuje

Skąd będzie wiadomo, co dany bit oznacza? Jeśli przeczytałeś dokładnie to, co napisałem powyżej, to rozumiesz, że takie rzeczy nie są dane z góry, tylko się je ustala. Konstruując układ z mikrokontrolerem, sam określisz znaczenia różnych bitów. Co więcej, ten sam bit w innym układzie może posiadać zupełnie inne znaczenie. Wszystko zależy od konstrukcji układu elektronicznego i to ty będziesz decydował, co w tym układzie znaczą przetwarzane bity.

Jeden bit jest małą jednostką. Co zrobić, gdy liczba wiadomości jest większa od 2? Odpowiedź jest prosta: bity łączysz w grupy i traktujesz taką grupę jak jeden sygnał. Jeśli połączysz ze sobą dwa bity, to otrzymasz 4 różne sygnały bitowe:

00: sygnał nr 1
01: sygnał nr 2
10: sygnał nr 3
11: sygnał nr 4

Cztery sygnały, to cztery wiadomości. Dla 3 bitów otrzymasz już 8 sygnałów, czyli będziesz w stanie działać na 8 różnych wiadomościach:

000: sygnał nr 1
001: sygnał nr 2
010: sygnał nr 3
011: sygnał nr 4
100: sygnał nr 5
101: sygnał nr 6
110: sygnał nr 7
111: sygnał nr 8

Dodając następny bit, otrzymasz 16 sygnałów. Każdy następny bit podwaja liczbę sygnałów:

2 → 4 → 8 → 16 → 32

Zwróć uwagę, że jest to ciąg potęg liczby 2. Wykładnik potęgi określa liczbę bitów w sygnale:

liczba bitów	liczba sygnałów	potęga 2
1	2	2¹
2	4	2²
3	8	2³
4	16	2⁴
5	32	2⁵
...	...	...
8	256	2⁸
...	...	...
16	65536	2¹⁶
...	...	...
32	4294967296	2³²
...	...	...
64	18446744073709551616	2⁶⁴
...	...	...

Ciąg ten nie ma końca. Dla każdej skończonej liczby wiadomości zawsze możemy dobrać tyle bitów w paczce, aby otrzymać pożądaną liczbę sygnałów. Na tym spostrzeżeniu opiera się cała współczesna technika cyfrowa.

Dlaczego wybrano akurat bity na jednostki informacji w komputerach? Odpowiedź jest prosta: pieniądze. Bity są proste, zatem przetwarzające je układy również są proste (w miarę), a zatem tanie w produkcji. Dodatkowo bity są bardziej odporne na zakłócenia od innych sygnałów. A na koniec, i tak przetwarzają je komputery, a nie my, ludzie. Więc co nam to szkodzi?

W pamięci komputera bity zapamiętuje się w paczkach po 8. Taką grupę ośmiu bitów nazywamy bajtem (ang. byte). Bity oznaczamy małą literą b, a bajty dużą literą B. Jeden bajt może przyjąć 256 różnych kombinacji swoich bitów.

W informatyce stosujemy następujące jednostki informacji:

bit	b	–	najmniejsza jednostka, dwa stany 0 i 1
kilobit	Kb	–	1024 bity
megabit	Mb	–	1024 Kb = 1048576 b
bajt	B	–	grupa 8 bitów, 256 stanów od 00000000 do 11111111
kilobajt	KB	–	1024 B
megabajt	MB	–	1024 KB = 1048576 B
gigabajt	GB	–	1024 MB = 1048576 KB = 1073741824 B
terabajt	TB	–	1024 GB = 1048576 MB = 1073741824 KB = 1099511627776 B
petabajt	PB	–	1024 TB = 1048576 GB = 1073741824 MB = 1099511627776 KB = 1125899906842624 B

Jednostki wielokrotne odpowiadają w przybliżeniu jednostkom stosowanym w fizyce, jednak w informatyce oparte są one na potęgach liczby 2, a nie na potęgach liczby 10:

kilo	K	–	2¹⁰
mega	M	–	2²⁰
giga	G	–	2³⁰
tera	T	–	2⁴⁰
peta	P	–	2⁵⁰

Dlaczego pojawia się tutaj liczba 2? Komputery są maszynami binarnymi. Potęgi liczby 2 są dla nich bardziej naturalne od potęg liczby 10 i lepiej wpisują się w ich architekturę.

W celu zaznaczenia tej różnicy, wielkości informatyczne pisze się dużą literą.

do podrozdziału do strony

Jak zaraz zobaczysz, bity pomimo swej prostoty nadają się doskonale do kodowania informacji.

Kodowanie grafiki

Cyfrowe urządzenia wyświetlają grafikę w postaci tzw. rastra:

Raster jest siatką punktów graficznych, które mogą przybierać różne kolory. Nazywamy je pikselami (ang. pixel = picture element – element obrazu). Piksele są zwykle tak małe, że oko ich nie zauważa jako osobny element obrazu – wyjątkiem są proste wyświetlacze o małej rozdzielczości, jak na powyższych obrazkach.

Załóżmy, że chcemy zakodować przy pomocy bitów poniższy obrazek:

W tej skali piksele nie są dobrze widoczne. Powiększy zatem ten obrazek, a uzyskamy widok tworzących go pikseli:

Tutaj wyraźnie widać, że piksele są tylko dwóch rodzajów: biały i czarny. Informacją do zakodowania jest właśnie kolor pikseli. Dwa kolory wymagają jednego bitu. Zróbmy następujące przypisanie:

	– bit 0
	– bit 1

Teraz można już zakodować kolor każdego piksela obrazka za pomocą bitów. Powstanie tzw. mapa bitowa, czyli odwzorowanie pikseli w bity:

0000111111110000
0011111111111100
0111111111111110
0111111111111110
1100000000000111
1000000000000011
1001111001111001
1000110000110001
1000000000000001
1000000000000001
1000001111000001
1000100000010001
0100011111100010
0100000000000010
0011100000011100
0000011111100000

Co zrobić w przypadku, gdy bity muszą przybierać więcej niż dwa kolory? Odpowiedzieliśmy na to pytanie w poprzednim podrozdziale: należy wziąć grupę bitów. Niech nasz obrazek wygląda następująco:

Powiększmy go odpowiednio, aby zobaczyć piksele:

Piksele na tym obrazku przyjmują cztery różne kolory. Mamy zatem do zakodowania cztery wiadomości o kolorze każdego piksela. Potrzebne są grupy dwubitowe:

	- 00

	- 01

	- 10

	- 11

Po przetworzeniu na bity powstaje mapa bitowa:

00000000010101010101010100000000
00000101010101010101010101010000
00010101010101010101010101010100
00010101010101010101010101010100
01011010101010101010101010010101
01101010101010101010101010100101
01101011111111101011111111101001
01101010111110101010111110101001
11101010101010101010101010101011
11101010101010101010101010101011
11101010101011111111101010101011
11101010111010101010101110101011
00111010101111111111111010101100
00111010101010101010101010101100
00001111111010101010101111110000
00000000001111111111110000000000

Jeśli kolorów jest więcej, to po prostu kodujemy je słówkami zbudowanymi z większej liczby bitów. Są to sprawy techniczne związane z implementacją grafiki. Poniższy obrazek jest zbudowany z pikseli o 256 kolorach, czyli każdy piksel jest kodowany za pomocą 8 bitów (u dołu obrazka pokazana jest paleta użytych kolorów):

Tzw. grafikę True color (prawdziwy kolor) tworzą piksele kodowane za pomocą 24 bitów, co daje paletę 16 milionów kolorów. W programach graficznych stosuje się grafikę nawet 48 bitową (w celu uzyskania płynnych przejść tonalnych na profesjonalnych wydrukach).

Kodowanie liczb

Do zapisu liczb oraz do obliczeń ludzie stosują tzw. system dziesiętny, który rozpowszechnił się w Europie w czasach średniowiecza za sprawą kupców arabskich, którzy przywieźli go z Indii. Genialność tego systemu polega na tym, iż za pomocą skończonej liczby symboli można zapisywać dowolne liczby. O wszystkim tym uczyłeś się w szkole, jednak uporządkujmy tę wiedzę.

W systemie dziesiętnym mamy dziesięć cyfr: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Liczby zapisujemy za pomocą ciągu tych cyfr (na razie pominiemy przecinek dziesiętny). Jednakże w zapisie tym cyfry posiadają różne wagi w zależności od swojej pozycji. Ostatnia pozycja ma wagę 1, poprzedzająca ją pozycja ma wagę 10, kolejne 100, 1000, 10000... Każda następna pozycja ma wagę 10 razy większą. Liczba 10 pełni ważną funkcję w tym systemie – nazywamy ją podstawą systemu. Dla przykładu zapiszmy pewną liczbę dziesiętną:

wagi:	...	10³ 1000	10² 100	10¹ 10	10⁰ 1
cyfry:	...	4	7	3	5
pozycje:	...	3	2	1	0

Zwróć uwagę, że waga pozycji ma wartość równą podstawie podniesionej do potęgi numeru pozycji. Cyfry informują nas, ile razy waga pozycji występuje w liczbie. I tak w naszej liczbie mamy 4 tysiące, 7 setek, 3 dziesiątki oraz 5 jednostek. Matematycznie wartość tej liczby można obliczyć mnożąc cyfry przez wagi ich pozycji i dodając otrzymane iloczyny:

4735 = 4 · 10³+ 7 · 10²+ 3 · 10¹+ 5 · 10⁰4735 = 4 · 1000 + 7 · 100 + 3 · 10 + 5 · 1

Z pozoru rachunki te mogą ci się wydać bezsensowne. Masz rację, w systemie dziesiętnym nie ma to wielkiego sensu. Jednak zasada obliczania wartości liczby będzie również obowiązywała, jeśli zmienimy podstawę, np. na 5. Co się w tedy stanie? Otrzymamy system piątkowy, w którym występuje tylko 5 cyfr: 0, 1, 2, 3, 4. Dlaczego? Wynika to z konstrukcji systemu pozycyjnego. W systemie dziesiętnym też nie mamy cyfr o wartościach większych od 9 (podstawa - 1). Zatem w systemie piątkowym liczby będziemy zapisywali za pomocą tylko tych pięciu cyfr. Zmianie ulegną również wagi pozycji, które teraz będą potęgami liczby 5, czyli nowej podstawy. Zapiszmy jakąś liczbę piątkową:

wagi:	...	5³ 125	5² 25	5¹ 5	5⁰ 1
cyfry:	...	3	4	2	4
pozycje:	...	3	2	1	0

Wszystkie systemy pozycyjne zbudowane są wg takiego samego schematu. Cyfry oznaczają zawsze liczbę wag pozycji, które wchodzą w skład liczby. Tutaj mamy:

3424₍₅₎ = 3 · 5³ + 4 · 5² + 2 · 5¹ + 4 · 5⁰3424₍₅₎ = 3 · 125 + 4 · 25 + 2 · 5 + 4 · 1
3424₍₅₎ = 375 + 100 + 10 + 4
3424₍₅₎ = 489

Indeks przy liczbie informuje, że jest to liczba piątkowa i należy jej cyfry interpretować wg wag piątkowych, a nie dziesiętnych. W naszym systemie, liczba ta ma wartość 489. W systemie piątkowym można zapisywać wszelkie liczby równie dobrze jak w systemie dziesiętnym.

Jeśli za podstawę systemu przyjmiemy 2, to otrzymamy system dwójkowy zwany również systemem binarnym (ang. binary system). Ilość cyfr zredukuje się do 2: 0 i 1. Wagi pozycji będą teraz potęgami liczby 2.

wagi:	...	2³8	2² 4	2¹ 2	2⁰ 1
cyfry:	...	1	1	0	1
pozycje:	...	3	2	1	0

Wartość liczby dwójkowej obliczamy identycznie jak wartość liczby w dowolnym innym systemie pozycyjnym (mnożymy cyfry przez ich wagi i dodajemy te iloczyny):

1101₍₂₎ = 1 · 2³  + 1 · 2² + 0 · 2¹ + 1 · 2⁰1101₍₂₎ = 1 · 8 + 1 · 4 + 0 · 2 + 1 · 2
1101₍₂₎ = 8 + 4 + 0 + 1
1101₍₂₎ = 13

W systemie dwójkowym jest nawet prościej niż w innych systemach, ponieważ waga albo występuje w liczbie (cyfra 1), albo nie występuje (cyfra 0). Zatem wcale nie trzeba nic mnożyć: wystarczy zsumować wagi tych pozycji, na których stoi cyfra 1. Wagi można dla ułatwienia sumować od końca zapisu liczby, wtedy kolejne wagi otrzymamy przez podwojenie wagi poprzedzającej, zaczynając od 1:

111010101₍₂₎ = 1 + 4 + 16 + 64 + 128 + 256
111010101₍₂₎ = 469

Cyfry liczby dwójkowej można reprezentować bezpośrednio bitami. Co więcej, nazwa bit oznacza właśnie cyfrę dwójkową: (ang. binary digit).

Kodowanie tekstu

Kodowanie tekstu nie różni się od kodowania kolorów pikseli w grafice. Tam kodowaną informacją był kolor piksela, tutaj kodowaną informacją będzie litera, a właściwie symbol drukarski. Koncepcja jest taka, aby każdemu znakowi przypisać inny kod bitowy. Istnieje wiele praktycznych systemów kodowania znaków. Mikrokontrolery najczęściej stosują kody ASCII, ponieważ są one 8-bitowe, a, jak zobaczymy dalej, jest to podstawowy rozmiar jednostki pamięci w mikrokontrolerach 8-bitowych.

ASCII (ang. American Standard Code for Information Interchange – Amerykański Standardowy Kod do Wymiany Informacji)

W ASCII każdy znak kodowany jest za pomocą 1 bajtu, czyli 8 bitów. Poniższa tabelka przedstawia kody podstawowego zestawu znaków ASCII:

Bin	Dec	Znak	Skrót
00000000	0	Null	NUL
00000001	1	Start of Heading	SOH
00000010	2	Start of Text	STX
00000011	3	End of Text	ETX
00000100	4	End of Transmission	EOT
00000101	5	Enquiry	ENQ
00000110	6	Acknowledge	ACK
00000111	7	Bell	BEL
00001000	8	Backspace	BS
00001001	9	Horizontal Tab	HT
00001010	10	Line Feed	LF
00001011	11	Vertical Tab	VT
00001100	12	Form Feed	FF
00001101	13	Carriage Return	CR
00001110	14	Shift Out	SO
00001111	15	Shift In	SI
00010000	16	Data Link Escape	DLE
00010001	17	Device Control 1 (XON)	DC1
00010010	18	Device Control 2	DC2
00010011	19	Device Control 3 (XOFF)	DC3
00010100	20	Device Control 4	DC4
00010101	21	Negative Acknowledge	NAK
00010110	22	Synchronous Idle	SYN
00010111	23	End of Transmission Block	ETB
00011000	24	Cancel	CAN
00011001	25	End of Medium	EM
00011010	26	Substitute	SUB
00011011	27	Escape	ESC
00011100	28	File Separator	FS
00011101	29	Group Separator	GS
00011110	30	Record Separator	RS
00011111	31	Unit Separator	US

Bin	Dec	Znak
00100000	32	Spacja
00100001	33	!
00100010	34	"
00100011	35	#
00100100	36	$
00100101	37	%
00100110	38	&
00100111	39	'
00101000	40	(
00101001	41	)
00101010	42	*
00101011	43	+
00101100	44	,
00101101	45	-
00101110	46	.
00101111	47	/
00110000	48	0
00110001	49	1
00110010	50	2
00110011	51	3
00110100	52	4
00110101	53	5
00110110	54	6
00110111	55	7
00111000	56	8
00111001	57	9
00111010	58	:
00111011	59	;
00111100	60	<
00111101	61	=
00111110	62	>
00111111	63	?

Bin	Dec	Znak
01000000	64	@
01000001	65	A
01000010	66	B
01000011	67	C
01000100	68	D
01000101	69	E
01000110	70	F
01000111	71	G
01001000	72	H
01001001	73	I
01001010	74	J
01001011	75	K
01001100	76	L
01001101	77	M
01001110	78	N
01001111	79	O
01010000	80	P
01010001	81	Q
01010010	82	R
01010011	83	S
01010100	84	T
01010101	85	U
01010110	86	V
01010111	87	W
01011000	88	X
01011001	89	Y
01011010	90	Z
01011011	91	[
01011100	92	\
01011101	93	]
01011110	94	^
01011111	95	_

Bin	Dec	Znak	Skrót
01100000	96	`
01100001	97	a
01100010	98	b
01100011	99	c
01100100	100	d
01100101	101	e
01100110	102	f
01100111	103	g
01101000	104	h
01101001	105	i
01101010	106	j
01101011	107	k
01101100	108	l
01101101	109	m
01101110	110	n
01101111	111	o
01110000	112	p
01110001	113	q
01110010	114	r
01110011	115	s
01110100	116	t
01110101	117	u
01110110	118	v
01110111	119	w
01111000	120	x
01111001	121	y
01111010	122	z
01111011	123	{
01111100	124	\|
01111101	125	}
01111110	126	~
01111111	127	Delete	DEL

Podstawowy zestaw znaków ASCII kodowany jest za pomocą 7 najmłodszych bitów. Kod bitowy znaku masz w kolumnie BIN (ang. binary – dwójkowo). Wartość kodu jako liczba dziesiętna znajduje się w kolumnie DEC. Zwróć uwagę, że pierwszy bit (zwany najstarszym lub najbardziej znaczącym bitem – ang. msb = most significant bit) jest w tych kodach ustawiony na 0. Kod znaku potraktowany jak liczba daje wartości od 0 (00000000) do 127 (01111111). Jeśli przyjrzysz się tej tabeli, to zauważysz, że znaki nie są ułożone w niej chaotycznie, tylko w 4 grupach:

Znaki sterujące (0...31)

0	0	0	x	x	x	x	x
znaki sterujące

Pierwszą grupę kodów ASCII tworzą tzw. znaki sterujące (ang. control characters). Posiadają one różne znaczenia w zależności od urządzenia, do którego zostaną przesłane. Zwykle powodują jakieś działanie, np. przejście do początku następnego wiersza (znaki LF i CR). W konsoli ekranowej niektóre z tych znaków mogą być wydrukowane, dając dodatkowe symbole. W przypadku mikrokontrolerów znaki będziesz wysyłał do różnych wyświetlaczy. Musisz dokładnie sprawdzić w instrukcji wyświetlacza, jaką funkcję realizują znaki z tej grupy kodów.

Znaki interpunkcyjne i cyfry (32...63)

Drugą grupę kodów ASCII tworzą znaki interpunkcyjne i cyfry. Znak o kodzie 32 (00100000) oznacza spację, czyli pusty odstęp.

0	0	1	1	x	x	x	x
cyfry

Cyfry mają kody od 48 (00110000) do 57 (00110000). Zwróć uwagę, iż po odjęciu liczby 48 od kodu ASCII cyfry (albo wyzerowaniu 4 najstarszych bitów) otrzymasz kod równy wartości tej cyfry:

kod ASCII			kod ASCII - 48
BIN	DEC	Znak	BIN	DEC
00110000	48	0	00000000	0
00110001	49	1	00000001	1
00110010	50	2	00000010	2
00110011	51	3	00000011	3
00110100	52	4	00000100	4
00110101	53	5	00000101	5
00110110	54	6	00000110	6
00110111	55	7	00000111	7
00111000	56	8	00001000	8
00111001	57	9	00001001	9

Odwrotnie też zadziała. Jeśli do wartości cyfry dodasz liczbę 48, to otrzymasz kod ASCII znaku tej cyfry. Informacje te są istotne, gdy spróbujesz samodzielnie napisać funkcje wypisujące liczby na wyświetlaczu lub w oknie konsoli. W dalszej części kursu pokażę, jak to się robi.

Znaki dużych liter (64...95)

Trzecią grupę tworzą głównie duże litery oraz kilka dodatkowych znaków. Litery mają kody od 65 (01000001 – A) do 90 (01011010 – Z). Litery są ułożone alfabetycznie (w celu ułatwienia operacji porównywania tekstów) od A do Z. Są to jednak znaki łacińskie. Nie znajdziesz wśród nich znaków polskich: Ą, Ć, Ę, ... Po prostu standard podstawowy ASCII ich nie przewiduje. Znaki narodowe trafiły do tzw. rozszerzonych kodów ASCII, w których najstarszy bit ma wartość 1. Dziesiętnie są to kody od 128 do 255 (o tych kodach przeczytasz poniżej).

Znaki małych liter (97...122)

W ostatniej, czwartej grupie kodów ASCII znalazły się małe litery oraz kilka dodatkowych znaków. Zwróć uwagę, że kod małej litery otrzymasz z kodu dużej litery po dodaniu liczby 32:

Litera A: kod 65

65 + 32 = 97

Litera a: kod 97

Jeśli od kodu małej litery odejmiesz 32, to otrzymasz kod litery dużej. Spostrzeżenie to przyda ci się, gdy będziesz potrzebował zamieniać znaki w tekście z małych na duże lub odwrotnie. Bitowo kody małych i dużych liter różnią się tylko jednym bitem, b₅:

Duże litery			Małe litery
BIN	DEC	Litera	BIN	DEC	Litera
01000001	65	A	01100001	97	a
01000010	66	B	01100010	98	b
01000011	67	C	01100011	99	c
...	...	...	...	...	...

W kodach dużych liter bit b₅ ma wartość 0, w kodach małych liter bit b₅ ma wartość 1.

Rozszerzony kod ASCII

podstawowy kod
ASCII

rozszerzony kod
ASCII

Oprócz podstawowego zestawu 128 kodów ASCII (0...127) używa się również kodów rozszerzonych (128...255). W kodach podstawowych najstarszy bit, b₇ ma wartość 0. W kodach rozszerzonych bit ten ma wartość 1. W rozszerzonym zestawie znaków ASCII są zdefiniowane znaki narodowe oraz różne dodatkowe znaki graficzne, np. do tworzenia tabelek. Tutaj mogą pojawić się kody polskich znaków, jednak w różnych standardach są to różne kody. Np. standard konsoli Windows (tzw. Latin II lub CP852) obsługuje następujące znaki rozszerzone:

znak(128) = Ç znak(160) = á znak(192) = └ znak(224) = Ó
znak(129) = ü znak(161) = í znak(193) = ┴ znak(225) = ß
znak(130) = é znak(162) = ó znak(194) = ┬ znak(226) = Ô
znak(131) = â znak(163) = ú znak(195) = ├ znak(227) = Ń
znak(132) = ä znak(164) = Ą znak(196) = ─ znak(228) = ń
znak(133) = ů znak(165) = ą znak(197) = ┼ znak(229) = ň
znak(134) = ć znak(166) = Ž znak(198) = Ă znak(230) = Š
znak(135) = ç znak(167) = ž znak(199) = ă znak(231) = š
znak(136) = ł znak(168) = Ę znak(200) = ╚ znak(232) = Ŕ
znak(137) = ë znak(169) = ę znak(201) = ╔ znak(233) = Ú
znak(138) = Ő znak(170) = ¬ znak(202) = ╩ znak(234) = ŕ
znak(139) = ő znak(171) = ź znak(203) = ╦ znak(235) = Ű
znak(140) = î znak(172) = Č znak(204) = ╠ znak(236) = ý
znak(141) = Ź znak(173) = ş znak(205) = ═ znak(237) = Ý
znak(142) = Ä znak(174) = « znak(206) = ╬ znak(238) = ţ
znak(143) = Ć znak(175) = » znak(207) = ¤ znak(239) = ´
znak(144) = É znak(176) = ░ znak(208) = đ znak(240) = 
znak(145) = Ĺ znak(177) = ▒ znak(209) = Đ znak(241) = ˝
znak(146) = ĺ znak(178) = ▓ znak(210) = Ď znak(242) = ˛
znak(147) = ô znak(179) = │ znak(211) = Ë znak(243) = ˇ
znak(148) = ö znak(180) = ┤ znak(212) = ď znak(244) = ˘
znak(149) = Ľ znak(181) = Á znak(213) = Ň znak(245) = §
znak(150) = ľ znak(182) = Â znak(214) = Í znak(246) = ÷
znak(151) = Ś znak(183) = Ě znak(215) = Î znak(247) = ¸
znak(152) = ś znak(184) = Ş znak(216) = ě znak(248) = °
znak(153) = Ö znak(185) = ╣ znak(217) = ┘ znak(249) = ¨
znak(154) = Ü znak(186) = ║ znak(218) = ┌ znak(250) = ˙
znak(155) = Ť znak(187) = ╗ znak(219) = █ znak(251) = ű
znak(156) = ť znak(188) = ╝ znak(220) = ▄ znak(252) = Ř
znak(157) = Ł znak(189) = Ż znak(221) = Ţ znak(253) = ř
znak(158) = × znak(190) = ż znak(222) = Ů znak(254) = ■
znak(159) = č znak(191) = ┐ znak(223) = ▀ znak(255) =

Polskie litery w różnych standardach mają kody:

	Ą	Ć	Ę	Ł	Ń	Ó	Ś	Ź	Ż	ą	ć	ę	ł	ń	ó	ś	ź	ż
Windows 1250	165	198	202	163	209	211	140	143	175	185	230	234	179	241	243	156	159	191
CP852	164	143	168	157	227	224	151	141	189	165	134	169	136	228	162	152	171	190

Różne kodowanie polskich znaków jest przyczyną kłopotów przy wyświetlaniu tekstu w Windows (Linux stosuje konsekwentnie standard ISO-8852-2 w całym systemie). Gdy pracujesz w edytorze, polskie znaki są kodowane wg standardu Windows-1250. Gdy uruchamiasz swój program, to pracuje on wg CP852, jednakże do konsoli wciąż wysyła kody Windows 1250, ponieważ tak było w programie źródłowym. Załóżmy, że chcesz wypisać w konsoli wyraz żółć. Co otrzymasz:

Litera	Windows 1250	CP852
ż	191	┐
ó	243	ˇ
ł	179	│
ć	230	Š

Zamiast słówka żółć w oknie konsoli pojawi się ┐ˇ│Š. Podobnie może być w mikrokontrolerach, jeśli obsługiwany wyświetlacz działa w innym systemie kodowania polskich liter niż edytor. Musisz na to zwrócić w przyszłości uwagę, jeśli zechcesz obsługiwać w swoim programie język polski. Cóż, standardy są dla wielkich, małymi nikt się nie przejmuje.

do podrozdziału do strony

Kod NBC

Liczby są podstawowym elementem przy programowaniu. Dlatego znajomość ich kodowania uważam za kluczową. W tym podrozdziale omówię podstawowe systemy kodowania liczb. Wcześniej podałem sposób kodowania liczb za pomocą bitów. Przypomnijmy:

Liczby kodujemy w systemie dwójkowym za pomocą dwóch cyfr 0 i 1. Wagi pozycji są kolejnymi potęgami liczby 2. Wartość liczby jest sumą wag pozycji zawierających cyfrę 1:

wagi:	...	2⁷ 128	2⁶ 64	2⁵ 32	2⁴ 16	2³ 8	2² 4	2¹ 2	2⁰ 1
cyfry:	...	1	1	0	0	1	0	1	1
pozycje:	...	7	6	5	4	3	2	1	0

11001011₍₂₎ = 1 + 2 + 8 + 64 + 128 = 203

Kod U2

Taki sposób zapisu liczb nosi nazwę naturalnego kodu binarnego czyli NBC (ang. Natural Binary Code). Kod NBC umożliwia kodowanie jedynie liczb dodatnich i zera. Jeśli chcemy również kodować liczby ujemne, to stosujemy tzw. kod uzupełnień do 2, zwany kodem U2. Kod U2 jest bardzo podobny do NBC, jedyną różnicą jest to, iż waga najstarszego bitu jest ujemna. Dzięki temu uzyskujemy możliwość kodowania liczb ujemnych. Zasada obliczania wartości liczby U2 jest identyczna jak dla liczby NBC: liczba jest sumą wag pozycji zawierających cyfry 1:

wagi:	...	-2⁷ -128	2⁶ 64	2⁵ 32	2⁴ 16	2³ 8	2² 4	2¹ 2	2⁰ 1
cyfry:	...	0	1	0	0	1	0	1	1
pozycje:	...	7	6	5	4	3	2	1	0

01001011₍₂₎ = 64 + 8 + 2 + 1 = 113

wagi:	...	-2⁷ -128	2⁶ 64	2⁵ 32	2⁴ 16	2³ 8	2² 4	2¹ 2	2⁰ 1
cyfry:	...	1	1	0	0	1	0	1	1
pozycje:	...	7	6	5	4	3	2	1	0

11001011₍₂₎ = -128 + 64 + 8 + 2 + 1 = -15

Najstarszy bit w liczbie U2 nosi nazwę bitu znaku (ang. sign bit). Jeśli bit znaku ma wartość 0, to liczba jest dodatnia, ponieważ żadna z pozostałych wag nie jest ujemna. Jeśli bit znaku ma wartość 1, to liczba jest ujemna, ponieważ suma pozostałych wag nie równoważy wartości wagi ujemnej.

Zakresy liczb

Liczby są przechowywane w pamięci komputera w postaci określonej liczby bitów. Najczęściej będzie to: 8, 16, 32 i 64 bity. Im więcej bitów w liczbie, tym większy zakres wartości może ona przybierać.

Policzmy zakres liczb NBC:

Najmniejszą wartość uzyskamy, gdy wszystkie bity będą zerami. Wtedy wartość liczby wynosi 0, ponieważ nie zawiera ona żadnej wagi.

Największą wartość otrzymamy, gdy wszystkie bity będą jedynkami. Wtedy każda waga wchodzi do wartości liczby. Jaką wartość przyjmuje liczba NBC, jeśli składa się z n jedynek? Spójrz poniżej:

Ilość bitów	Liczba NBC	Wartość	Związek
1	1	1	2 - 1	2¹ - 1
2	11	3	4 - 1	2² - 1
3	111	7	8 - 1	2³ - 1
4	1111	15	16 - 1	2⁴ - 1
5	11111	31	32 - 1	2⁵ - 1
6	111111	63	64 - 1	2⁶ - 1
7	1111111	127	128 - 1	2⁷ - 1
8	11111111	255	256 - 1	2⁸ - 1
...	...	...	...	...
16	1111...1111	65535		2¹⁶ - 1
...	...	...		...
32	1111...1111	4294967295		2³² - 1
...	...	...		...
64	1111...1111	18446744073709551615		2⁶⁴ - 1
...	...	...		...
n	1111...1111	2ⁿ - 1

W tabelce podane są wartości liczb binarnych zbudowanych z coraz większej liczby jedynek. Zauważamy, że wartość takiej liczby jest równa 2ⁿ - 1, gdzie n oznacza ilość jedynek. Na tej podstawie zapisujemy, że zakres n bitowych liczb w kodzie NBC jest równy:

0 ... 2ⁿ - 1

A teraz liczby U2. Najmniejszą wartość uzyskamy, gdy bit znaku będzie ustawiony na 1, a wszystkie pozostałe bity będą równe 0. Wartość takiej liczby składa się tylko z wagi ujemnej.

Ilość bitów	Liczba U2	Wartość	Związek
1	1	-1	-(2⁰)	-(2^1-1)
2	10	-2	-(2¹)	-(2^2-1)
3	100	-4	-(2²)	-(2^3-1)
4	1000	-8	-(2³)	-(2^4-1)
5	10000	-16	-(2⁴)	-(2^5-1)
6	100000	-32	-(2⁵)	-(2^6-1)
7	1000000	-64	-(2⁶)	-(2^7-1)
8	10000000	-128	-(2⁷)	-(2^8-1)
...	...	...	...	...
16	1000...0000	-32768	-(2¹⁵)	-(2^16-1)
...	...	...	...	...
32	1000...0000	-2147483648	-(2³¹)	-(2^32-1)
...	...	...	...	...
64	1000...0000	-9223372036854775808	-(2⁶³)	-(2^64-1)
...	...	...	...	...
n	1000...0000	-(2^n-1)

Liczba U2 przyjmuje największą wartość, gdy bit znaku jest ustawiony na 0, a wszystkie pozostałe bity mają wartość 1. Wtedy wartość liczby zawiera wszystkie wagi dodatnie.

Ilość bitów	Liczba U2	Wartość	Związek
1	0	0	2⁰ - 1	2^1-1 - 1
2	01	1	2¹ - 1	2^2-1 - 1
3	011	3	2² - 1	2^3-1 - 1
4	0111	7	2³ - 1	2^4-1 - 1
5	01111	15	2⁴ - 1	2^5-1 - 1
6	011111	31	2⁵ - 1	2^6-1 - 1
7	0111111	63	2⁶ - 1	2^7-1 - 1
8	01111111	127	2⁷ - 1	2^8-1 - 1
...	...	...	...	...
16	0111...1111	32767	2¹⁵ - 1	2^16-1 - 1
...	...	...	...	...
32	0111...1111	2147483647	2³¹ - 1	2^32-1 - 1
...	...	...	...	...
64	0111...1111	9223372036854775807	2⁶³ - 1	2^64-1 - 1
...	...	...	...	...
n	0111...1111	2^n-1 - 1

I ostatecznie otrzymujemy zakres n bitowej liczby U2:

-(2^n-1 )...2^n-1 - 1

Porównajmy zakresy liczb NBC i U2 w typowych formatach:

Ilość bitów	Zakres NBC	Zakres U2
4	0...15	-8...7
8	0...255	-128...127
12	0...4095	-2048...2047
16	0...65535	-32768...32767
32	0...4294967295	-2147483648...2147483647
64	0...18446744073709551615	-9223372036854775808...9223372036854775807

do podrozdziału do strony

Kody binarne są dla ludzi mało czytelne. Łatwo tu o pomyłkę. Dlatego programiści chętniej stosują inne systemy liczbowe, które jednak w prosty sposób odwzorowują kod dwójkowy. Takim systemem jest system ósemkowy zwany również oktalnym.

W systemie ósemkowym podstawa wynosi 8 i do zapisu liczby stosujemy 8 cyfr od 0 do 7. Ponieważ liczba 8 jest potęgą liczby 2 (8 = 2³), to istnieje bardzo prosty sposób konwersji pomiędzy systemem ósemkowym a dwójkowym (konwersja polega na zapisaniu tej samej liczby w innym systemie liczbowym). Będzie potrzebna tabela wartości cyfr ósemkowych w systemie dwójkowym:

Cyfra ósemkowa	Wartość dwójkowa
0	000
1	001
2	010
3	011
4	100
5	101
6	110
7	111

Naucz się na pamięć tej tej tabelki lub zapamiętaj, że cyfrze ósemkowej zawsze będzie odpowiadała trzybitowa liczba NBC o wartości tej cyfry.

Liczbę dwójkową konwertujemy na ósemkową następująco:

Mamy liczbę dwójkową:

01111110100100010001000111₍₂₎

Dzielimy ją na grupy po 3 bity poczynając od prawej strony:

01 111 110 100 100 010 001 000 111

Jeśli ostatnia grupa nie zawiera 3 bitów, to uzupełniamy je bitami 0 do trójki:

001 111 110 100 100 010 001 000 111

Każdą trójkę bitów zastępujemy odpowiadającą jej cyfrą ósemkową z tabelki:

001	111	110	100	100	010	001	000	111
1	7	6	4	4	2	1	0	7

Konwersja skończona:

01111110100100010001000111₍₂₎ = 176442107₍₈₎

Otrzymana w ten sposób liczba ósemkowa posiada dokładnie taką samą wartość jak wyjściowa liczba dwójkowa. Czytelność liczby ósemkowej jest dużo większa od odpowiadającej jej liczby dwójkowej.

W odwrotną stronę postępujemy podobnie:

Mamy liczbę ósemkową:

2607531₍₈₎

Zamieniamy każdą jej cyfrę na grupę 3 bitów zgodnie z tabelką:

2	6	0	7	5	3	1
010	110	000	111	101	011	001

Konwersja skończona:

2607531₍₈₎ = 010110000111101011001₍₂₎

Gdy nabierzesz wprawy, będziesz wykonywał taką konwersję w locie.

do podrozdziału do strony

Drugim chętnie stosowanym systemem zapisu liczb jest system szesnastkowy zwany również heksadecymalnym. W systemie szesnastkowym podstawa wynosi 16 (2⁴) i liczby zapisujemy za pomocą 16 cyfr. Ponieważ cyfry kończą się na 9, to za brakujące przyjęto 6 początkowych liter alfabetu od A do F. Wartości cyfr szesnastkowych są następujące:

Cyfra szesnastkowa	0	1	2	3	4	5	6	7	8	9	A	B	C	D	E	F
Wartość cyfry	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15

Do konwersji używamy tabelki zamiany cyfr szesnastkowych na bity. Każda cyfra szesnastkowa odpowiada 4 bitom. Naucz się tej tabelki na pamięć:

Cyfra szesnastkowa	Wartość dwójkowa
0	0000
1	0001
2	0010
3	0011
4	0100
5	0101
6	0110
7	0111
8	1000
9	1001
A	1010
B	1011
C	1100
D	1101
E	1110
F	1111

Konwersji dokonujemy podobnie jak przy konwersji ósemkowej:

Mamy liczbę dwójkową:

01111110100100010001000111₍₂₎

Dzielimy ją na grupy po 4 bity poczynając od prawej strony:

01 1111 1010 0100 0100 0100 0111

Jeśli ostatnia grupa nie zawiera 4 bitów, to uzupełniamy je bitami 0 do czwórki:

0001 1111 1010 0100 0100 0100 0111

Każdą czwórkę bitów zastępujemy odpowiadającą jej cyfrą szesnastkową zgodnie z podaną tabelką:

0001	1111	1010	0100	0100	0100	0111
1	F	A	4	4	4	7

Konwersja skończona:

01111110100100010001000111₍₂₎ = 1FA4447₍₁₆₎

W drugą stronę:

Mamy liczbę szesnastkową:

6FB87A3₍₁₆₎

Zamieniamy każdą jej cyfrę na grupę 4 bitów zgodnie z tabelką:

6	F	B	8	7	A	3
0110	1111	1011	1000	0111	1010	0011

Konwersja skończona:

6FB87A3₍₁₆₎ = 0110111110111000011110100011₍₂₎

Liczby szesnastkowe lepiej oddają wartości dwójkowe przetwarzane przez komputer niż liczby ósemkowe. Na przykład bajt można ładnie przedstawić za pomocą dwóch cyfr szesnastkowych (4 + 4 bity). Natomiast liczba ósemkowa bajt musi zakodować za pomocą 3 cyfr (2 + 3 + 3 bity).

do podrozdziału do strony

Kod NBC pozwala zapisywać liczby całkowite dodatnie oraz liczbę zero.

Kod U2 pozwala zapisywać liczby całkowite dodatnie, ujemne oraz liczbę zero.

Jak zapisać za pomocą bitów liczby ułamkowe, które są potrzebne do różnych obliczeń naukowych? Reguły kodowania liczb ułamkowych wymyślono dawno temu. Już w roku 1936 Konrad Zuse zbudował pierwszy na świecie komputer dwójkowy, który pracował z takimi właśnie liczbami. Aby zrozumieć sposób zapisu liczb ułamkowych, posłużmy się liczbami dziesiętnymi. Przecinek rozdziela część całkowitą od części ułamkowej:

wagi:	...	10³ 1000	10² 100	10¹ 10	10⁰ 1		10^-1 ¹/₁₀	10^-2 ¹/₁₀₀	10^-3 ¹/₁₀₀₀	10^-4 ¹/₁₀₀₀₀	...
cyfry:	...	2	7	1	5	,	3	2	9	4
pozycje:	...	3	2	1	0		-1	-2	-3	-4	...
		część całkowita					część ułamkowa

2 · 10³ + 7 · 10² + 1 · 10¹ + 5 · 10⁰ + 3 · 10^-1 + 2 · 10^-2 + 9 · 10^-3 + 4 · 10^-4

Cyfry po lewej stronie przecinka określają część całkowitą liczby. Ich pozycje numerujemy kolejno od zera w górę w kierunku z prawa na lewo. Wagi pozycji całkowitych są potęgami podstawy o wykładniku równym numerowi pozycji.

Cyfry po prawej stronie przecinka określają część ułamkową liczby. Ich pozycje numerujemy od -1 w kierunku coraz mniejszych liczb ujemnych. Zwróć uwagę, że jest to zupełnie naturalne przedłużenie numeracji pozycji obecnej po stronie całkowitej. Wagi pozycji w części ułamkowej również są potęgami podstawy o wykładnikach równych numerom pozycji, tylko teraz te wykładniki to liczby ujemne. Z matematyki wiemy, że:

Stąd otrzymujemy wagi ułamkowe: 0,1 0,01 0,001 ... Zasada obliczania wartości liczby nie ulega zmianie: mnożymy cyfry przez ich wagi i sumujemy otrzymane iloczyny.

W systemie dwójkowym jest dokładnie tak samo. Zmieniają się tylko wartości wag pozycji, które teraz będą potęgami liczby 2, a nie 10.

wagi:	...	2³ 8	2² 4	2¹ 2	2⁰ 1		2^-1 ¹/₂	2^-2 ¹/₄	2^-3 ¹/₈	2^-4 ¹/₁₆	...
cyfry:	...	1	1	0	1	,	1	1	0	1
pozycje:	...	3	2	1	0		-1	-2	-3	-4	...
		część całkowita					część ułamkowa
1101,1101₍₂₎ = 8 + 4 + 1 + ¹/₂ + ¹/₄ + ¹/₁₆1101,1101₍₂₎ = 13 + ¹³/₁₆1101,1101₍₂₎ = 13,8125

Taki zapis liczby nosi nazwę zapisu stałoprzecinkowego (ang. fixed point notation). Jeśli chcemy zakodować liczbę w tym systemie, musimy określić pozycję przecinka, ponieważ nie jest on bitem i nie można go sobie tak wstawić pomiędzy cyfry dwójkowe. Po prostu liczbę 1101,1101 zapisujemy w pamięci jako 11011101, lecz pamiętamy, że ostatnie cztery bity są bitami ułamkowymi.

Z zapisem zmiennoprzecinkowym spotkałeś się na pewno na fizyce, gdy należało zapisać jakieś bardzo duże lub bardzo małe liczby. Na przykład:

2,4 · 10⁶⁷

Zwróć uwagę, że tak zapisana liczba składa się faktycznie z trzech osobnych liczb:

2,4 – mantysa m, określa wartość podstawową liczby
10 – podstawa systemu zapisu liczb p
67 – cecha c, określa wykładnik

Wartość liczby liczymy jako m · p^c.

Liczba tak zapisana nosi nazwę liczby zmiennoprzecinkowej (ang. floating point number). Dlaczego? Zmieniając odpowiednio mantysę i cechę możemy ustawić przecinek w dowolnym miejscu:

2,4 · 10⁶⁷ = 0,24 · 10⁶⁸ = 0,024 · 10⁶⁹ = 24,0 · 10⁶⁶= 240 · 10⁶⁵ = ...

Dlatego umówiono się, że liczby takie będą zawsze prezentowane w postaci znormalizowanej, tzn. takiej, iż mantysa ma wartość pomiędzy 1 a 10. Z liczby zmiennoprzecinkowej wystarczy zapamiętać mantysę i cechę, ponieważ wiemy, że podstawą systemu dziesiętnego jest 10. Zatem w postaci znormalizowanej nasza liczba może być zapisana jako:

2,4 67

Niektóre kalkulatory w ten właśnie sposób prezentują liczby zmiennoprzecinkowe (zwane również inżynierskimi lub naukowymi):

-1,234567809 · 10^-35

Jak odnieść to do systemu dwójkowego? Prosto: w kodzie liczby należy zapamiętać cechę oraz znormalizowaną mantysę. Tutaj przyjęto, iż znormalizowana mantysa ma wartość mniejszą od 1. Wagi mantysy dwójkowej są następujące:

wagi:	...	2^-1 ¹/₂	2^-2 ¹/₄	2^-3 ¹/₈	2^-4 ¹/₁₆	...
cyfry:	...	0/1	0/1	0/1	0/1	...
pozycje:	...	-1	-2	-3	-4	...

Na początku dodajemy jeden bit znaku:

bit znaku 0 – mantysa jest dodatnia

bit znaku 1 – mantysa jest ujemna

Oprócz mantysy w kodzie liczby zostaje również umieszczona cecha, np. jako liczba U2. Dla przykładu stwórzmy taki "szkolny" kod zmiennoprzecinkowy. Umówmy się, że pierwsze cztery bity będą określały cechę liczby w kodzie U2, kolejny bit będzie bitem znaku mantysy, a ostatnie trzy bity będą reprezentowały mantysę:

wagi:

-(2³)
-8

2²
4

2¹
2

2⁰
1

2^-1
¹/₂

2^-2
¹/₄

2^-3
¹/₈

cyfry:

cecha

mantysa

c	–	bit cechy
z	–	bit znaku
m	–	bit mantysy

Załóżmy, że mamy następujący kod:

00100101

Rozdzielamy go na części składowe:

0010 0 101

0010 – cecha = 2
0 – bit znaku, mantysa dodatnia

101 – bity ułamkowe mantysy, m = ¹/₂ + ¹/₈ = ⁵/₈

Obliczamy wartość:

m · p^c = ⁵/₈ · 2² = ⁵/₈ · 4 = ⁵/₂ = 2,5

Inny przykład:

11011111
1101 1 111
1101 – cecha = -8 + 4 + 1 = -3
1 – bit znaku, mantysa ujemna
111 – bity ułamkowe mantysy, m = -(¹/₂+ ¹/₄ + ¹/₈) = -(⁷/₈)

Obliczamy wartość:

m · p^c = -(⁷/₈) · 2^-3= -(⁷/₈) · ¹/₈ = -(⁷/₆₄) = -0,109375

Liczba bitów mantysy określa tzw. precyzję liczby. Im tych bitów więcej, tym dokładniej można odwzorować daną wartość rzeczywistą. W naszym przykładowym systemie zmiennopozycyjnym mantysa posiada długość 3 bitów. Pozwala ona zakodować tylko takie liczby binarne, które można sprowadzić do tych 3 bitów przez usunięcie zer wiodących lub końcowych: np.: 111 1010 0,0111 itp. Natomiast nie da się zakodować liczb: 1001 111100 0,1011. Liczby te wymagają precyzji 4 bitów (po usunięciu zer wiodących i końcowych pozostają nam 4 bity, a mantysa potrafi zapamiętać tylko 3 bity).

Liczba bitów cechy wpływa na zakres wartości. Im tych bitów więcej, tym większy jest zakres liczb zmiennoprzecinkowych.

Zagadnienia związane z liczbami zmiennoprzecinkowymi są trudne dla początkujących. Dlatego zakończymy ich opis w tym miejscu, aby nie zanudzać cię zbędnymi ci w tym momencie szczegółami technicznymi. Jeśli chcesz wiedzieć więcej na ten temat, to proponuję ci przeczytanie artykułu o binarnym kodowaniu liczb.

Zapraszamy do następnego rozdziału.

do podrozdziału do strony

Materiały tylko do użytku dydaktycznego. Ich kopiowanie i powielanie jest dozwolone pod warunkiem podania źródła oraz niepobierania za to pieniędzy.
Pytania proszę przesyłać na adres email: i-lo@eduinf.waw.pl
Serwis wykorzystuje pliki cookies. Jeśli nie chcesz ich otrzymywać, zablokuj je w swojej przeglądarce.

Informacje dodatkowe.

Warsztat

Kurs języka C

Typy danych

Bity

Kodowanie informacji za pomocą bitów

Kodowanie grafiki

Kodowanie liczb

Kodowanie tekstu

Znaki sterujące (0...31)

Znaki interpunkcyjne i cyfry (32...63)

Znaki dużych liter (64...95)

Znaki małych liter (97...122)

Rozszerzony kod ASCII

Liczby całkowite

Kod NBC

Kod U2

Zakresy liczb

Liczby ósemkowe

Liczby szesnastkowe

Liczby zmiennoprzecinkowe