Categorías: Todo - вероятность - информация - символы - алфавит

por Юлия Беспалова hace 2 años

219

Объёмный подход

Формула Хартли даёт способ измерения количества информации, основываясь на количестве возможных событий. Информация, которую несёт каждый символ, вычисляется через логарифм мощности алфавита.

Объёмный подход

Формула хартли

Количество возможных событий и количество информации

N=2^i

Количество информации, которое несёт каждый символ

i=log2N N - мощность алфавита

Единицы измерения

Килобайт (Кбайт) = 1024 байт Мегабайт (Мбайт) = 1024 Кбайт Гигабайт (Гбайт) = 1024 Мбайт Терабайт (Тбайт) = 1024 Гбайт Петабайт (Пбайт) = 1024 Тбайт Эксабайт (Эбайт) = 1024 Пбайт Зеттабайт (Збайт) = 1024 Эбайт Йоттабайт (Йбайт) = 1024 Збайт

k - символов

V=K⋅i

V=K⋅log2N

Объёмный подход

Вероятностный подход

Примеры
В корзине лежат 8 черных шаров и 24 белых. Сколько информации несет сообщение о том, что достали черный шар?

N1 = 8 черных шаров N2 = 24 белых шаров N = 8 + 24 = 32 шара всего p = 8/32 = 1/4 вероятность того, что достали черный шар I = log 1/(1/4) = 2 бита

Пусть вероятность выпадения осадков в виде дождя равна 0,5, ветра - 0,25, грозы и молнии - 0,125. Какое количество информации получится при реализации одного из событий?

I = - (0.5 log 0.5 + 0.25 log 0.25 + 0.125 log 0.125) = 1.75 бит

Пусть бри бросании несимметричной четырехгранной пирамидки вероятности отдельных событий равны: p1 = 1/2 p2 = 1/4 p3 = 1/8 p4 = 1/8 Какой количество информации

I = -( 1/2 log 1/2 + 1/4 log 1/4 + 1/8 log 1/8 *2) = 14/8 = 1.75 бит

Формула Шеннона
Формула
Вероятностный подход предполагает, что возможные события имеют различные вероятности реализации.
2^i = 1/p
Вероятность
Вероятностью случайного события (p) называется отношение числа благоприятствующих событию исходов (m) к общему числу исходов (n): p = m/n

случайное событие - событие, которое может произойти или не произойти (например, выигрыш билета в лотерее, извлечение карты определенной масти из колоды карт).

множество исходов испытания - множество всех возможных исходов испытания;

исходы испытаний - результаты испытания (например, при подбрасывании монеты выпал «орел», или из корзины извлекли белый шар);

единичное испытание - испытание, в котором совершается одно действие с одним предметом (например, подбрасывается монетка, или из корзины извлекается шар);

испытание - любой эксперимент;

Содержательный подход

примеры
Шахматная доска состоит из 64 полей: 8 столбцов на 8 строк. Какое количество бит несет сообщение о выборе одного шахматного поля?

Поскольку выбор любой из 64 клеток равновероятен, то количество бит находится из формулы: 2^i =64, i=log2 64 = 6. Следовательно, i=6 бит.

загадали некоторое целое число в определённом диапазоне. Угадывая это число, получили 7 бит информации. Сколько чисел содержит диапазон?

i = 7, 2^i = N, N = 2^7 = 128 чисел

в доме 16 этажей, на каждом этаже по 4 квартиры. Какое количество информации несёт сообщение о том, что Игорь живет на 7-ом этаже в квартире №47?

всего в доме 16*4 = 64 квартиры, т.е. N = 64 i = log2N = log 64 = 6 бит

количество информации, заключенное в сообщении, определяется объемом знаний, который это сообщение несет получающему его человеку. Если сообщение не информативно, то количество информации с точки зрения человека = 0

Алфавитный подход

Примеры задач
В рулетке общее количество лунок равно 128. Какое количество информации мы получаем в зрительном сообщения об остановке шарика в одной из лунок?

N = 128 I = log2N = log128 = 7 бит

Информационное сообщение объемом 1,5 Кб содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?

I = 1,5 Кб = 1,5*1024 = 1536 байта = 1536*8 = 12288 бит i = I/K = 12288/3072 = 4 бита N = 2^i = 2^4 = 16 символов

Одно племя имеет 32-символьный алфавит, а второе племя – 64-символьный алфавит. Вожди племен обменялись письмами. Письмо первого племени содержало 80 символов, а письмо второго племени – 70 символов. Сравните объем информации, содержащийся в письмах.

Первое племя: 2^i = 32, i = 5 бит - количество информации, которое несёт каждый символ, 5*80=400 бит Второе племя: 2^i = 64, i = 6 бит - количество информации, которое несёт каждый символ, 6*70=420 бит Следовательно, письмо второго племени содержит больше информации

Мощность алфавита - количество символов используемых в алфавите
Мощность русского алфавита = 256 (2^8)
Алфавит- множество используемых символов в языке.
1 символ = 8 бит
позволяет определить количество информации, заключенной в тексте, записанном с помощью некоторого алфавита.