1. Приведите примеры ситуаций, когда смысл информации особого значения не имеет, а важен только её объём.
Примеры ситуаций, когда смысл информации не важен, а важен только ее объем: счетчики (электричества, воды), статистические данные (продажи), архивы больших данных (обработка изображений, медицинских записей), поиск в поисковой системе (большое количество результатов без учета их смысла).
2. Какие утверждения справедливы для алфавитного подхода:
а) количество информации зависит от длины сообщения;
б) количество информации зависит от мощности алфавита;
в) чем больше мощность алфавита, тем больше количество информации;
г) важен смысл сообщения;
д) сообщение должно быть понятно для приёмника;
е) разные символы могут нести разное количество информации.
Для алфавитного подхода справедливы утверждения: а) количество информации зависит от длины сообщения; б) количество информации зависит от мощности алфавита; в) чем больше мощность алфавита, тем больше количество информации.
3. Технический документ перевели с одного языка на другой (считаем, что это было сделано максимально близко к тексту). Изменился ли смысл документа? Изменился ли его объём?
Смысл, при качественном переводе, остается неизменным. Объем может измениться из-за различий в длине предложений, частоте слов или специфике технических терминов на разных языках.
4. Как вы думаете, почему компьютеру легко извлечь несколько предложений с конкретных страниц документа, но трудно составить аннотацию к нему?
Компьютер легко извлекает предложения с конкретных страниц, потому что это механическая задача поиска по тексту. Составление аннотации требует понимания смысла, обобщения, анализа – качеств, которые пока не доступны компьютерам в такой же степени, как поиск слов.
5. Работа в парах. Придумайте задачу на вычисление количества информации и решите её. Затем предложите напарнику сделать то же самое. Сравните ваши результаты.
Задача: Алфавит состоит из 4 символов (A, B, C, D). Какое количество информации несет сообщение, состоящее из 3 символов этого алфавита?
Решение: Количество информации в одном символе равно log₂(4) = 2 бита. Общее количество информации в сообщении из 3 символов равно 3 символа * 2 бита/символ = 6 бит.