1.МЕТОД РЕШЕНИЯ ЗАДАЧИ И ЕЁ ФОРМАЛИЗАЦИЯ
1.1 Типы и функции знаков препинания
Знаки препинания — элементы письменности, выполняющие вспомогательные функции разделения (выделения) смысловых отрезков текста, предложений, словосочетаний, слов, частей слова, указания на грамматические и логические отношения между словами, указания на коммуникативный тип предложения, его эмоциональную окраску, законченность, а также некоторые иные функции.
Знаки препинания, синтаксически оформляющие текст, облегчают его зрительное восприятие и понимание, а при воспроизведении текста вслух помогают осуществить его интонационное оформление (интонация, смысловые паузы, логические ударения).
Перечислим все существующие знаки препинания и дадим кратко описание каждому.
« » - Пробел служит для отделения слов друг от друга.
« . » - Точка позволяет нам разделять текст на предложения. Также точка служит для сокращения длинных
« , » Запятая позволяет нам расставить акценты, отделить слова друг от друга внутри предложения.
« ? » Знак вопроса позволяет нам сделать предложение «спрашивающим».
« ! » Восклицательный знак приходит к нам на помощь тогда, когда нужно придать более выраженный эмоциональный окрас предложению.
«…» Многоточие (три точки) мы используем, когда хотим обозначить паузу или недосказанность в повествовании
«””» Кавычки - ими мы выделяем цитаты, прямую речь, названия, слова в переносном значении.
« - » Тире или дефис. Используется, как короткое тире без пробелов в словах типа «когда-либо, кто-то, как-нибудь», так и длинное в предложениях. Тире служит своего рода мостом между словами или предложениями, обозначая их взаимосвязь.
« : » Двоеточием мы обозначаем принадлежность последующей части предложения к предыдущей.
« ; » Точка с запятой. Этот знак мы используем обычно с той же целью, что и запятую. Стоит сказать о том, что если запятая – это своего рода интонационная пауза с целью разделения, то точка с запятой – это интонационная пауза, но чуть длиннее и значительнее.
«()» Скобками мы отделяем подразумевающийся текст, который не согласуется с другими частями в предложении. Обычно в скобках пишутся: уточнения, какие - то подробности и детали.
« ’ » Апостроф. Этим знаком, как правило, отделяют одну часть слова от другой в сложных фамилиях (Жанна д’Арк, д’Артаньян) а также в словах с частью слова на латинице.
«Абзац» - знак препинания, обозначаемый абзацем, – это, по сути, переход на новую строку.
Мы перечислили и раскрыли все знаки препинания в русском языке существующие на сегодняшний день. [10]
Для анализа выбираю наиболее востребованные (используемые) знаки препинания, а именно
. , - !" ; : ? ( ) ’ { } [ ]
1.2 Виды кодировки текста
То, что отображается на экране как текст, фактически хранится в текстовом файле в виде числового значения. Компьютер преобразует числические значения в видимые символы. Для этого используется кодикон.
Кодировка — это схема нумерации, согласно которой каждому текстовому символу в наборе соответствует определенное числовое значение. Кодировка может содержать буквы, цифры и другие символы. В различных языках часто используются разные наборы символов, поэтому многие из существующих кодировок предназначены для отображения наборов символов соответствующих языков.
В текстовых файлах могут использоваться различные кодировки.
Кодовая страница (англ. code page) — таблица, сопоставляющая каждому значению байта некоторый символ (или его отсутствие). Обычно код символа имеет размер 8 бит, так что кодовая страница может содержать максимум 256 символов, из чего вытекает резкая недостаточность всякой 8-битной кодовой страницы для представления многоязычных текстов. К тому же часть символов используется как управляющие, из-за чего число печатных символов редко превышает 223.
В интерфейсе современных версий операционной системы Microsoft Windows имеется два способа представления текста:
• в форме традиционных 8-битных кодовых страниц
• в виде UTF-16.
ASCII (англ. American Standard Code for Information Interchange) — американский стандартный код для обмена информацией. ASCII представляет собой кодировку для представления десятичных цифр, латинского и