Вернуться к главной статье.

Теперь, если перейти от выборок в сотнях до единичных, убедимся, что число:

сильно отличается от

0.432 * 0.568 = 0.245376 :

Коэффициент дисперсии (здесь немного отклонимся от обычных вычислений, согласно которым, нужно было извлечь квадратный корень из числа, которое называется коэффициент дисперсии) является

то есть примерно 1/5, что объясняется связью между выборками.
Выявление этой связи, помогает приблизительно вычислить вероятности p1 и p0. Для исследования мы взяли 20000 букв из начала поэмы, чтоб посчитать количество последовательностей

гласная, гласная,

и в результате получили 1104; после деления на общее число букв в тексте, мы получили приближенное значение p1:

Точно так же можно найти значение q0

согласная, согласная

и разделив на 11,362, получим p0 = 1 - q0 . Однако, можно заменить столь утомительные подсчеты следующим образом. Если вычесть 1104 из 8638, получим число согласных

7534,

которые следуют за гласной,и как все согласные, кроме первой должны следовать либо за гласной, либо за согласной, число последовательностей

согласная, согласная

определяется разностью

11,361 - 7534 = 3827.

таким образом, мы получили приближенное значение для p0



<< предыдущая страница | следующая страница >>