На свете существует огромное множество языков. Они делятся на разные группы. Это деление происходит на основе формальных признаков. Каждая группа языков характеризуется определенными формальными признаками. Но отдельные признаки не всегда принадлежат только одной группе языков. Отдельные языки могут характеризоваться разными формальными признаками. Эти языки распределяются по определенным группам на основе сопоставления разных формальных признаков. Определяющим здесь является количественный фактор. Группы языков с определенными формальными признаками именуются "формальными классами языков".
Текст, независимо от его объема, рассматривается как закрытый язык, не имеющий субъязыков. Он, следовательно, семантически полностью изолирован, и семантика составляющих его слов определяется целиком рамками одного этого текста. В сравнительно ограниченных языках, минующих морфологию, словоформы могут признаваться раздельными словами. При этом предлоги не отделяются от слов, которыми управляют.
Взятый для образца текст в целях наглядности несколько упрощен - он не включает придаточных предложений. Процедура анализа сложных предложений подчинена принципу иерархии комплексов.
Весь текст последовательно сегментируется двумя способами с использованием двоичной классификации иерархических единиц языка.
1. Слова (набор букв в тексте между двумя пробелами) записываются в канонической форме: существительные - в именительном падеже единственного числа, глаголы в инфинитиве и т. д.
2. Словосочетания - пары слов, объединенные синтаксической связью, при которой одно слово управляет другим.