-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Добавить неполное ООП в Модульный Рефал #1
Comments
Для back-end’а SimRef АДТ можно представлять проще:
Нет никакой необходимости мудрить с двойным вложением. |
Как реализовать наследованиеНаследование реализовать можно. Но, прежде чем, подойдём к синтаксису и идеям реализации, нужно очертить границы, в рамках которых ведётся проектирование. ООППримем за отправную точку, что ООП подразумевает три вещи: инкапсуляцию (сокрытие внутреннего состояния объекта), наследование (см. далее) и полиморфизм. Вообще, определений ООП много, здесь примем, что ООП в Модульном Рефале будет реализовано полностью, если реализованы эти три концепции.
Требования к наследованиюДля начала нужно определить понятие «наследование». Наследование — механизм языка, позволяющий создавать новые классы на основе существующих, при этом класс-наследник получает некоторую функциональность своего предка. Наследование позволяет повторно использовать код класса-предка, а также определяет отношение подтипизации (классы-наследники являются подмножеством классов-предков). Некоторые свойства:
И всё это нужно положить на язык программирования Модульный Рефал. Свойства Модульного Рефала, которым должно удовлетворять наследование:
В ОО-языках с ссылочными типами данных внутри методов доступна ссылка В Модульном Рефале ссылок нет, поэтому в «методах» класса нужно целиком иметь весь объект, но при этом доступ должен быть открыт только к части объекта на соответствующем уровне иерархии. Требуется реализовать перечисленные выше свойства наследования при перечисленных ограничениях Модульного Рефала. Синтаксис и семантикаКлассы с наследованием расширяют предложенный ранее полиморфизм, т.е. синтаксис, описанный выше, остаётся актуальным. Также остаются актуальным некоторые решения проектирования:
Синтаксически обращение к классу будет выглядеть так:
Описанная выше конструкция — это образец терма. o-переменная — терм самого объекта, по смыслу — t-переменная. Применение o-@-конструкции:
Описанный синтаксис позволяет работать с объектом целиком (как с термом), но при этом видеть только данные, характерные для данного уровня иерархии. Данные предков в равной степени невидимы, как и данные потомков. Для объекта целиком (o-переменной) можно вызывать виртуальные функции, и эти функции будут вызваны в соответствии с динамическим типом объекта. Почему нельзя обойтись одними только t-переменными? Зачем потребовались o-переменные? Рассмотрим функцию
Функция у объекта меняет тег слоя
Функция В случае синтаксиса с o-переменными, как например, в функции Но как же создать такой объект? Ведь синтаксис выше слои не создаёт, число слоёв и порядок сохраняется прежним. А вот здесь приходится вводить понятие конструктора. Конструктор — функция, создающая некоторый объект с нуля. Синтаксически оформляется так:
Метка <>-@-конструкция — это синтаксис вида
где в угловых скобках может находиться только вызов конструктора. Конструктор может быть только функцией из другого модуля, вызывать конструктор из текущего модуля запрещено на уровне синтаксиса. При выполнении <>-@-конструкции новый слой добавляется к объекту. Запрет на вызов конструктора из своего модуля (другого конструктора или себя рекурсивно) предотвращает циклическое накопление слоёв одного уровня иерархии. В результате число слоёв оказывается не большим глубины импорта модулей, т.к. циклический импорт запрещён. Другие вопросыПоведение виртуальных функций никак не меняется. В расширениях виртуальных функций на месте метки Выше сказано, что o-переменные не могут быть повторными. Можно разрешить повторные o-переменные со следующим ограничением: только одна из них в образце может иметь вырезку, остальные не могут. Соответственно, допускаются и переменные без вырезок в образце, но они могут быть только повторными (другое её вхождение обязано иметь вырезку). О реализацииРеализация таких объектов станет сложнее, нежели просто добавления полиморфизма АТД-термам. Скорее всего, объекты будут представлены как списки слоёв:
При вызове виртуальной функции слои будут перебираться справа-налево (если потомки добавляются справа) в поисках первого тега, который реализует данное поведение. При этом реализация обычных АДТ-термов не изменится. Различать теги (классы/данные) можно будет по конструкторам: если тег данных в конструкторе не используется, то базовым классом он быть не может — добавлять новые слои можно только в <>-@-конструкциях. Детально описывать реализацию я пока не планирую. Это более технический вопрос, нежели идеологический, опишу, если (когда) буду всё это реализовывать. ЗаключениеРасширить язык объектами с наследованием можно. При этом и объекты останутся типами-значениями, и паттерн шаблонный метод сможет работать, и расширение будет не сильно уходить от духа Модульного Рефала. Однако, расширение наследованием более громоздко, нежели расширение полиморфизмом. В схеме с полиморфизмом нет явных классов — для разных тегов АТД можно реализовать разные виртуальные функции, причём совершенно несогласованно:
В схеме с наследованием точно также нет явной иерархии, расширяться слоем может любой объект любого класса:
Очевидно, это плохой стиль. Но также очевидно, что попытки ограничить эту свободу заметно усложнят реализацию — для явной иерархии придётся вводить и явные классы, а значит, усложнять синтаксис и семантику. На вопрос, заданный ранее
половина ответа нашлась. Но осталась вторая половина: а нужно ли наследование в Модульном Рефале? |
Уточнение предыдущего комментарияМожно различать классы и абстрактные типы данных. Первые участвуют в иерархии, вторые — нет. Классы объявляются ключевым словом Можно вообще ввести для классов универсальный базовый класс А в свете последнего, Если экземпляры классов представляются как
Интересным следствием такой семантики будет то, что если расширение для потомка не перехватило аргумент, то данный аргумент может быть перехвачен предком. Считать это багой или фичей — мне пока не очевидно. Вообще, это фича. Отсутствие расширения для потомка должно рассматриваться как расширение с нулём предложений. С другой стороны — отсутствие расширения для потомка означает использование функции базового класса. Так что данную семантику можно определить и иначе. Для объекта со слоями Очень странное ООП получается. Но в духе Модульного Рефала. Самому интересно, что откроется мне дальше. Когда я начинал писать комментарий, я думал написать только о ключевом слове |
Мотивация
Модульный Рефал имеет встроенный механизм инкапсуляции данных — так называемые «абстрактные типы данных», АТД. Модуль может определить несколько «тегов типа» — имён АТД, которыми может помечать некоторые скобочные термы (собственно, АТД-термы). Непосредственный доступ к содержимому АДТ-термов возможен только в функциях модуля, в котором определены метки. Другие модули могут манипулировать с АТД-термами, либо импортируя модуль, где они определены и вызывая его entry-функции, либо вызывая функции-callback’и того модуля.
Механизм АТД решает свою задачу: предотвращает доступ извне к содержимому, но при этом налагает жёсткое ограничение: либо нужно импортировать модуль, либо передавать callback, либо доступа вообще нет. Таким образом, возникают затруднения при написании некоторых универсальных служб (служб, которые могут работать с любыми объектными выражениями): сортировка, преобразование к строке, сериализация.
Другое ограничение АТД (в широком смысле) в модульных языках (Модульный Рефал, Модула-2) — необходимость прямого или косвенного импорта модуля, реализующего тип данных в модулях, использующих экземпляры этого типа. В результате возникает слишком жёсткая связь между отдельными компонентами (например, в синтаксическом анализаторе захардкожена ссылка на лексический анализатор).
Решение обеих проблем хорошо известно: разделение типа и интерфейса. Первая проблема решается тем, что универсальные службы предлагают интерфейс (например,
ToString
), который должны реализовать все типы, совместимые со службой. Вторая проблема решается тем, что клиенты зависят только от описания интерфейса, экземпляр типа, реализующий требуемый интерфейс, передаётся в клиенты методами верхнего уровня.Предлагаемое решение
Концепция
В Модульном Рефале единица инкапсуляции — модуль. Это свойство разумно сохранить. Модульный Рефал — функциональный язык, поэтому интерфейс опишем как набор переопределяемых функций. Как-то так.
Некоторые модули предоставляют виртуальные функции, набор этих функций формирует некоторый интерфейс. Другие модули импортируют модули с виртуальными функциями и расширяют последние дополнительными предложениями, обрабатывающими АТД, реализованные в данном модуле. После чего можно вызывать виртуальные функции, передавая в них экземпляры АТД, для которых эти функции расширены. Виртуальные функции (они всегда экспортируются, пишем
$VIRTUAL
, подразумеваем$ENTRY
) могут вызываться как из модулей, где они определены, так и из модулей, которые импортируют модули с виртуальными функциями. При этом последние ничего не знают о модулях, которые расширяют виртуальные функции.Синтаксис
Виртуальная функция помечается ключевым словом
$VIRTUAL
и имеет одно и только одно виртуальное предложение. Виртуальное предложение состоит из одного образца (для краткости далее виртуального образца), который (а) может быть только жёстким образцом (без повторных переменных и открытых e-переменных), (б) должен содержать хотя бы один терм вида$DATA
— признак виртуального предложения. Перед и после виртуального предложения могут располагаться обычные предложения с обычной семантикой.Расширение виртуальной функции может располагаться только в модуле, который импортирует модуль, определяющий виртуальную функцию. Расширение виртуальной функции записывается как функция, помеченная ключевым словом
$EXTENDS
и имеющая имяИмяМодуля.ИмяВиртуальнойФункции
, гдеИмяМодуля
— имя модуля, где виртуальная функция определена. При этом в модуле не может дважды переопределяться одна и та же виртуальная функция. Каждое предложения расширения должно уточнять виртуальный образец, при этом на месте терма$DATA
должен располагаться АТД-терм. Соответствие образцовых частей расширения виртуальному образцу должно контролироваться на стадии компиляции.Расширение виртуальной функции самостоятельной функцией не является, предложения, перечисленные в теле функции, можно вызвать только вызывав виртуальную функцию. Соответственно, ключевое слово
$ENTRY
к расширению не применимо ибо бессмысленно.Семантика
Примечание. Здесь описывается идеализированная модель, реализация может (и будет) отличаться, но её поведение должно совпадать с идеализированной моделью.
После компиляции и компоновки формируется единая программа, в которой каждая виртуальная функция превращается в обычную функцию, в которой на месте виртуального предложения располагаются предложения всех расширений этой виртуальной функции. При этом относительный порядок предложений, описанных в расширении сохраняется, но относительный порядок предложений различных расширений не определён, ибо не важен (см. ниже).
Следовательно, исполнение виртуальной функции идёт в следующем порядке:
$DATA
. В модуле, расширяющем виртуальную функцию, могут использоваться только теги данных, которые в нём определены, поэтому образцы предложений различных модулей не конфликтуют между собой. Если одно из сопоставлений завершилось успешно, выполняется соответствующее предложение расширения и виртуальная функция завершается.Пара слов о синтаксисе
$VIRTUAL
и$EXTENDS
избыточны: виртуальную функцию можно узнать по наличию виртуального предложения, расширение — по квалифицированному имени. Однако, добавление этих ключевых слов повышает ясность и читабельность программы.[$ENTRY] ИмяФункции $EXTENDS Модуль.ВиртуальнаяФункция
— создаёт как обычную функцию (с именемИмяФункции
), так и расширениеМодуль.ВиртуальнаяФункция
с идентичным набором предложений.Реализация
Back-end C++/SR
Непосредственная реализация семантики затруднена: модули транслируются независимо в исходные файлы на C++, которые затем уже транслируются компилятором C++. Поэтому будем действовать иначе.
Допустим, выполнение виртуальной функции дошло до виртуального предложения. Сопоставим аргумент с виртуальным образцом — допустим, оно прошло успешно, каждый из символов
$DATA
наложился на АТД-терм. Возьмём, к примеру, первое вхождение символа$DATA
— зная тип АТД, мы можем узнать модуль, в котором он переопределён, и попытаться в этом модуле найти расширение виртуальной функции. Расширение нашли — можем попробовать сопоставить аргумент с каждой из левых частей предложений расширения. Если одно из предложений расширения выполнилось, то виртуальная функция на этом завершается, иначе происходит переход на предложения, следующие за виртуальным. Заметим, что другие расширения виртуальной функции проверять не нужно — они не могут содержать на месте$DATA
чужой АТД.Очевидно, что путь поиска расширения избыточен: из цепочки тег АТД → модуль → расширение можно выкинуть модуль, храня в теге непосредственно расширения для разных АТД, причём только те предложения из расширений, которые относятся к данному типу.
На данный момент тег типа для АТД представляет собой пустую функцию, поскольку его роль — только отличать друг от друга разные АТД. Поэтому его можно пополнить новой информацией, новым поведением без конфликтов с имеющимся кодом.
Виртуальная функция при компиляции представляется в виде пары: префикс — функция, состоящая из предложений по виртуальное включительно и суффикс — функция, состоящая из предложений, которые следуют за виртуальным. Суффикс может быть и пустой функцией. Для примера, пусть у нас компилируется функция
Модуль.Гладить
— имя префикса будет совпадать с именем функции, имя суффикса будет иметь видМодуль.Гладить%суф
. (Реализация может давать любое имя, как угодно декорированное, такое, что пользователь не сможет его перекрыть). Модуль:будет компилироваться во что-то вроде:
Здесь используется синтаксически невозможная
[s.Tag e.Info]
, которая позволяет извлечь тег типа из АТД для осуществления косвенного вызова. Тег АТД является функцией, которая принимает указатель на суффикс и исходный аргумент, причём указатель на суффикс играет две роли: во-первых, служит тегом виртуальной функции, во-вторых, на него передаётся управление в случае невозможности сопоставления. На примере модуля-клиента всё будет понятно.компилируется в
Теги типов становятся уже таблицами виртуальных функций. Последнее предложение каждой виртуальной функции служит для передачи управления на суффикс, АТД, для которых расширения не определены, состоят только из одного такого предложения.
Back-end Простого Рефала
Реализуется аналогично back-end’у C++/SR с той лишь разницей, что конструкция
[s.Tag e.Info]
синтаксически недопустима, а значит, нужно идти в обход.АТД, не участвующие в каком-либо расширении виртуальных функций, описываются как и раньше — пустая функция для тега и
[Tag e.Info]
для АТД-термов. Для типов, участвующих в расширении виртуальных функций тег описывается также, как и для предыдущего back-end’а, а терм —[Class Tag [Tag e.Info]]
— таким образом, (а) по-прежнему обеспечивается инкапсуляция, но при этом есть доступ к тегу типа. ТегClass
глобален на всю программу, объявляется в файле.main.sref
как$EENUM
.Виртуальные предложения ожидают, что типы данных имеют вид
[Class Tag [Tag e.Info]]
, поэтому при передаче в них АТД, не участвующих в расширениях виртуальных функций, выполнение сразу передаётся на суффикс. Пример выше может быть откомпилирован так:Back-end Рефала-5
Поскольку стадия компоновки является частью Модульного Рефала, здесь можно непосредственно реализовать семантику.
Заключение
Описанный механизм позволяет внедрить механизм полиморфизма в Модульный Рефал, причём минимальными синтаксическими расширениями. Механизм расширяет и дополняет имеющийся в языке механизм инкапсуляции. Если в дальнейшем в языке появится статическая типизация, то описанные синтаксис и семантика могут быть легко интегрированы в систему типов (в отличие от ООП на основе вложенных функций).
Как внедрить наследование реализации, а главное, стоит ли его внедрять — вопрос открытый.
The text was updated successfully, but these errors were encountered: